UNIVARIATEプロシジャ

記述統計量

このセクションでは、PROC UNIVARIATEステートメントで計算される記述統計量の計算の詳細を示します。これらの統計量は、OUTPUTステートメントで表4.60にあるキーワードを指定することにより、OUT=データセットに保存することもできます。

標準アルゴリズム(Fisher; 1973)は、積率統計量の計算に使用されます。UNIVARIATEプロシジャで使用される計算方法は、他のSASプロシジャで記述統計量の計算に使用される計算方法との間に一貫性があります。

次のセクションでは、UNIVARIATEプロシジャで計算されるいくつかの統計量の詳細を示します。

平均

標本平均は次のように計算されます。

$\text{[math]}$

$\text{[math]}$ は変数の非欠損値の数、 $\text{[math]}$ は変数の $\text{[math]}$ 番目の値、 $\text{[math]}$ は変数の $\text{[math]}$ 番目の値に関連付けられた重みです。WEIGHT変数が存在しない場合、この式は次のようになる。

$\text{[math]}$

合計

合計は $\text{[math]}$ で計算されます。 $\text{[math]}$ は変数の非欠損値の数、 $\text{[math]}$ は変数の $\text{[math]}$ 番目の値、 $\text{[math]}$ は変数の $\text{[math]}$ 番目の値に関連付けられた重みです。WEIGHT変数が存在しない場合、この式は $\text{[math]}$ に短縮します。

重みの合計

重みの合計は $\text{[math]}$ で計算されます。 $\text{[math]}$ は変数の非欠損値の数、 $\text{[math]}$ は変数の $\text{[math]}$ 番目の値に関連付けられた重みです。WEIGHT変数が存在しない場合、重みの合計は $\text{[math]}$ です。

分散

分散は次のように計算されます。

$\text{[math]}$

$\text{[math]}$ は変数の非欠損値の数、 $\text{[math]}$ は変数の $\text{[math]}$ 番目の値、 $\text{[math]}$ は重み付き平均、 $\text{[math]}$ は変数の $\text{[math]}$ 番目の値に関連付けられた重み、 $\text{[math]}$ はPROC UNIVARIATEステートメントのVARDEF=オプションで制御される分母です。

$\text{[math]}$

WEIGHT変数が存在しない場合、この式は次のようになる。

$\text{[math]}$

標準偏差

標準偏差は次のように計算されます。

$\text{[math]}$

歪度

標本歪度は、偏差がある方向で他の方向より大きいという偏差の傾向を測定し、VARDEF=オプションに応じて次のように計算されます。

表4.111 歪度の計算式
VARDEF	公式
DF(デフォルト)	$\text{[math]}$
N	$\text{[math]}$
WDF	欠損値
WEIGHT \| WGT	欠損値

ここで、 $\text{[math]}$ は変数の値が欠損値以外のオブザベーション数、 $\text{[math]}$ は変数の $\text{[math]}$ 番目の値、 $\text{[math]}$ は標本平均、 $\text{[math]}$ は標本標準偏差、 $\text{[math]}$ は変数の $\text{[math]}$ 番目の値に割り当てられる重みを表す VARDEF=DFの場合、 $\text{[math]}$ は2より大きい必要があります。WEIGHT変数が存在しない場合、 $\text{[math]}$ すべてで $\text{[math]}$ になります。

標本歪度は正または負の値になります。データ分布の非対称性を測定し、理論歪度 $\text{[math]}$ を推定します。 $\text{[math]}$ および $\text{[math]}$ は2番目および3番目の中心積率です。オブザベーションが正規分布である場合、歪度は0に近くなります。

尖度

標本尖度は、標本の裾の重さを測定し、VARDEF=オプションに応じて次のように計算されます。

表4.112 尖度の計算式
VARDEF	公式
DF(デフォルト)	$\text{[math]}$
N	$\text{[math]}$
WDF	欠損値
WEIGHT \| WGT	欠損値

ここで、 $\text{[math]}$ は変数の値が欠損値以外のオブザベーション数、 $\text{[math]}$ は変数の $\text{[math]}$ 番目の値、 $\text{[math]}$ は標本平均、 $\text{[math]}$ は標本標準偏差、 $\text{[math]}$ は変数の $\text{[math]}$ 番目の値に割り当てられる重みを表す VARDEF=DFの場合、 $\text{[math]}$ は3より大きい必要があります。WEIGHT変数が存在しない場合、 $\text{[math]}$ すべてで $\text{[math]}$ になります。

標本尖度はデータ分布の裾の重さを測定します。 $\text{[math]}$ で示される調整された理論尖度を推定します。 $\text{[math]}$ で、 $\text{[math]}$ が4番目の中心積率です。オブザベーションが正規分布である場合、尖度は0に近くなります。

変動係数(CV)

変動計数は次のように計算されます。

$\text{[math]}$