UNIVARIATEプロシジャ

 
パーセント点の計算

UNIVARIATEプロシジャは、各分析変数の最小値および最大値と、1番目、5番目、10番目、25番目、50番目、75番目、90番目、95番目、99番目のパーセント点(分位点)を自動的に計算します。これらのデフォルトパーセント点以外のパーセント点を計算するには、OUTPUTステートメントのPCTLPTS=オプションおよびPCTLPRE=オプションを使用します。

PCTLDEF=オプションで、5つのパーセント点計算定義のうち1つを指定できます。は変数の非欠損値の数、は並べ替えられた変数の値を表すとします。また、番目のパーセント点がであるとし、と設定し、次のとおりであるとします。

     

ここで、npの整数部分、npの小数部分です。この場合、PCTLDEF=オプションは、番目のパーセント点を次の表の説明のように定義します。

PCTLDEF

説明

公式

1

での重み付き平均

   

ここで、 と解釈される

2

npに最も近い番号のオブザベーション

3

経験分布関数

4

重み付き平均

 

を目的とします

ここで、 と解釈される

5

平均化された経験分布関数

重み付きパーセント点

WEIGHTステートメントを使用する場合、パーセント点は異なる方法で計算されます。100番目の重み付きパーセント点は、平均化された経験分布関数から計算されます。

     

ここで、に関連付けられた重みで、は重みの合計です。

PCTLDEF=オプションは、WEIGHTステートメントが使用される場合は適用されません。ただし、この場合、重みがすべて同じであれば、重み付きパーセント点は、WEIGHTステートメントを使用せずにPCTLDEF=5で計算されるパーセント点と同じになります。

パーセント点の信頼区間

CIPCTLNORMALオプションを使用すると、データが正規分布であると仮定して、パーセント点の信頼限界を要求できます。これらの限界については、Hahn and Meeker (1991)のセクション4.4.1で説明されています。 の場合、両側の 信頼限界( 番目のパーセント点に対するもの)は次のようになる

     

は標本サイズです。 の場合、両側の 信頼限界( 番目のパーセント点に対するもの)は次のようになる

     

片側の信頼限界は、適切な前の式のに置き換えて計算されます。因子は非心分布に関連し、Owen and Hua (1977)およびOdeh and Owen (1980)で説明されています。例4.10を参照してください。

CIPCTLDFオプションを使用すると、パーセント点の分布によらない信頼限界を要求できます。特に、データが正規分布であると仮定する必要がありません。これらの限界については、Hahn and Meeker (1991)のセクション5.2で説明されています。番目のパーセント点の両側の信頼限界は次のとおりです。

     

は、データ値が昇順で並べ替えられている場合の番目の順序統計量です。

     

下のランクと上のランクは、の前後で対称(またはほぼ対象)な整数です。の整数部分で、は標本サイズです。また、は、次の包含確率要件を満たしながら、ができるだけに近くなるように選択されます。

     

は次の累積二項確率です。

     

特にが小さく、が0または1に小さい場合は、包含要件を満たすことができないことがあります。対称性の要件を緩和するには、CIPCTLDF(TYPE = ASYMMETRIC)を指定できます。このオプションは、包含要件を満たすことができる場合は対称限界を要求し、それ以外の場合は非対称限界を要求します。

CIPCTLDF(TYPE = LOWER)を指定すると、片側の下位信頼限界がとして計算されます。は次の非同等性を満たす最も大きい整数です。

     

ただし、とします。同様に、CIPCTLDF(TYPE = UPPER)を指定すると、片側の下位信頼限界がとして計算されます。は次の非同等性を満たす最も大きい整数です。

     

パーセント点の信頼限界は、WEIGHTステートメントが指定されている場合は計算されません。例4.10を参照してください。