UNIVARIATEプロシジャ

 
記述統計量

このセクションでは、PROC UNIVARIATEステートメントで計算される記述統計量の計算の詳細を示します。これらの統計量は、OUTPUTステートメントで表4.60にあるキーワードを指定することにより、OUT=データセットに保存することもできます。

標準アルゴリズム(Fisher; 1973)は、積率統計量の計算に使用されます。UNIVARIATEプロシジャで使用される計算方法は、他のSASプロシジャで記述統計量の計算に使用される計算方法との間に一貫性があります。

次のセクションでは、UNIVARIATEプロシジャで計算されるいくつかの統計量の詳細を示します。

平均

標本平均は次のように計算されます。

     

は変数の非欠損値の数、は変数の番目の値、は変数の番目の値に関連付けられた重みです。WEIGHT変数が存在しない場合、この式は次のようになる。

     

合計

合計はで計算されます。は変数の非欠損値の数、は変数の番目の値、は変数の番目の値に関連付けられた重みです。WEIGHT変数が存在しない場合、この式はに短縮します。

重みの合計

重みの合計はで計算されます。は変数の非欠損値の数、は変数の番目の値に関連付けられた重みです。WEIGHT変数が存在しない場合、重みの合計はです。

分散

分散は次のように計算されます。

     

は変数の非欠損値の数、は変数の番目の値、は重み付き平均、は変数の番目の値に関連付けられた重み、はPROC UNIVARIATEステートメントのVARDEF=オプションで制御される分母です。

     

WEIGHT変数が存在しない場合、この式は次のようになる。

     

標準偏差

標準偏差は次のように計算されます。

     

は変数の非欠損値の数、は変数の番目の値、は重み付き平均、は変数の番目の値に関連付けられた重み、はPROC UNIVARIATEステートメントのVARDEF=オプションで制御される分母です。WEIGHT変数が存在しない場合、この式は次のようになる。

     

歪度

標本歪度は、偏差がある方向で他の方向より大きいという偏差の傾向を測定し、VARDEF=オプションに応じて次のように計算されます。

表4.111 歪度の計算式

VARDEF

公式

DF(デフォルト)

N

WDF

欠損値

WEIGHT | WGT

欠損値

ここで、は変数の値が欠損値以外のオブザベーション数、は変数の番目の値、は標本平均、は標本標準偏差、は変数の番目の値に割り当てられる重みを表す VARDEF=DFの場合、は2より大きい必要があります。WEIGHT変数が存在しない場合、すべてでになります。

標本歪度は正または負の値になります。データ分布の非対称性を測定し、理論歪度を推定します。およびは2番目および3番目の中心積率です。オブザベーションが正規分布である場合、歪度は0に近くなります。

尖度

標本尖度は、標本の裾の重さを測定し、VARDEF=オプションに応じて次のように計算されます。

表4.112 尖度の計算式

VARDEF

公式

DF(デフォルト)

N

WDF

欠損値

WEIGHT | WGT

欠損値

ここで、は変数の値が欠損値以外のオブザベーション数、は変数の番目の値、は標本平均、は標本標準偏差、は変数の番目の値に割り当てられる重みを表す VARDEF=DFの場合、は3より大きい必要があります。WEIGHT変数が存在しない場合、すべてでになります。

標本尖度はデータ分布の裾の重さを測定します。で示される調整された理論尖度を推定します。で、が4番目の中心積率です。オブザベーションが正規分布である場合、尖度は0に近くなります。

変動係数(CV)

変動計数は次のように計算されます。