UNIVARIATEプロシジャ

 
位置の検定

PROC UNIVARIATEでは、スチューデントの検定、符号検定およびWilcoxonの符号付き順位検定の3つの位置の検定を行うことができます。3つの検定はすべて、平均値または中央値がに等しくない両側対立仮説に対する、平均値または中央値が指定した値に等しい帰無仮説の検定統計量を作成します。デフォルトでは、PROC UNIVARIATEはの値を0に設定します。PROC UNIVARIATEステートメントのMU0=オプションを使用して、の値を指定できます。スチューデントの検定は、母集団が正規分布に近いデータの場合に適しています。それ以外の場合は、符号検定や符号付き順位検定などのノンパラメトリックな検定を使用します。母集団が大きい場合、検定は漸近的に検定と同等になります。WEIGHTステートメントを使用すると、PROC UNIVARIATEは位置の重み付き検定である検定を1つだけ計算します。PROCステートメントのVARDEF=オプションのデフォルト値(VARDEF=DF)を使用する必要があります。例4.12を参照してください。

また、これらの検定を使用して、対応のあるデータの平均値または中央値を比較できます。同じ年齢と性別を持つサブジェクトなど、一対のサブジェクトやユニットが1つ以上の変数を基準に一致している場合、データは対応していると言います。対応のあるデータは、各サブジェクトまたはユニットが2回測定される場合や、2つの条件で測定される場合にも出現します。2回の平均値または中央値を比較するには、2つの指標の間の差である分析変数を作成します。変数の平均値または中央値の差が0に等しい検定は、2つの元の変数の平均値または中央値が等しい検定と同じです。これらの検定は、TTESTプロシジャのPAIREDステートメントを使用して実行することもできます。Chapter 95, The TTEST Procedure (SAS/STAT User's Guide)を参照してください。また、例4.13を参照してください。

スチューデントのt検定

PROC UNIVARIATEは、統計量を次のように計算します。

     

は標本平均、は変数の非欠損値の数、は標本標準偏差です。帰無仮説は、母集団平均がに等しいことです。データ値が正規分布に近似している場合、帰無仮説下の統計量が極端である、つまり観測値よりも極端となる確率(値)は、自由度が分布から取得されます。が大きい場合、統計量は漸近的に検定と同等になります。WEIGHTステートメントとVARDEF=のデフォルト値(DF)を使用するとき、統計量は次のように計算されます。

     

は重み付き平均、は重み付き標準偏差、番目のオブザベーションの重みです。統計量は、自由度がのスチューデントの分布として扱われます。PROCステートメントでEXCLNPWGTオプションを指定する場合、はWEIGHT変数が正のときの非欠損オブザベーションの数です。デフォルトでは、はWEIGHT変数の非欠損オブザベーションの数です。

符号検定

PROC UNIVARIATEは、符号検定統計量を次のように計算します。

     

より大きい値の数、より小さい値の数です。に等しい値は破棄されます。母集団中央値がに等しいという帰無仮説のもとで、観測された統計量値は次のようになります。

     

に等しくない値の数です。

: が等しい場合、値は1です。

Wilcoxonの符号付き順位検定

符号付き順位統計量は次のように計算されます。

     

の値を破棄した後のの順位、に等しくない値の数です。結合された値には平均順位が使用されます。

の場合、の有意性はの厳密分布から計算されます。この分布は調整された二項分布の畳み込みです。の場合、の有意性の計算は次のように行います。

     

これを自由度がのスチューデントの変量として扱うことによって、優位性が計算されます。は次のように計算されます。

     

この合計は絶対値がタイのグループの合計です。は、番目のグループの値の数です(Iman; 1974; Conover; 1999)。分布が対称であると仮定して、平均値(または中央値)がであるという帰無仮説が検定されます。Lehmann (1998)を参照してください。