FREQプロシジャ: 二項比率 :: Base SAS(R) 9.3プロシジャガイド: 統計プロシジャ

二項比率

TABLESステートメントでBINOMIALオプションを指定すると、FREQプロシジャは1元表での二項比率を計算します。デフォルトでは、これは、出力に表示される最初の変数水準のオブザベーションの割合になります。なお、二項比率の異なる水準を指定するには、LEVEL=オプションを使用します。二項比率は次のように計算されます。

$\text{[math]}$

ここで、 $\text{[math]}$ は最初の(または指定された)水準の度数であり、 $\text{[math]}$ は1元表の合計度数です。二項比率の標準誤差は次のように計算されます。

$\text{[math]}$

二項分布の信頼限界

デフォルトでは、FREQプロシジャは、二項比率に関する漸近信頼限界および正確な(Clopper-Pearson)信頼限界を提供します。binomial-optionsで信頼限界要求を指定しない場合、FREQプロシジャは、標準Wald漸近信頼限界を計算します。また、二項比率に関するAgresti-Coull信頼限界やWilson(スコア)信頼限界も要求できます。これらの二項比率の信頼限界の詳細やその性能の比較については、Brown, Cai, and DasGupta (2001)、Agresti and Coull (1998)、Newcombe (1998)を参照してください。

Wald信頼区間

標準Wald信頼限界は、二項分布に対する正規近似に基づきます。FREQプロシジャは、二項分布のWald信頼限界を次のように計算します。

$\text{[math]}$

ここで、 $\text{[math]}$ は標準正規分布の $\text{[math]}$ 番目のパーセント点です。信頼水準 $\text{[math]}$ は、ALPHA=オプションで指定されます。これは、デフォルトでは0.05であり、95%の信頼限界を生成します。

CORRECT binomial-optionまたはBINOMIALCオプションを指定すると、FREQプロシジャは、Wald漸近信頼限界に $\text{[math]}$ の連続補正を含めます。この補正の目的は、正規近似と、離散型分布である二項分布との間の差異を調整することにあります。詳細は、Fleiss, Levin, and Paik (2003)を参照してください。連続補正を使用する場合、二項比率の漸近信頼限界は次のように計算されます。

$\text{[math]}$

Agresti-Coull信頼限界

AGRESTICOULL binomial-optionを指定すると、FREQプロシジャは二項比率のAgresti-Coull信頼限界を次のように計算します。

$\text{[math]}$

ここで、

$\text{[math]}$	$\text{[math]}$	$\text{[math]}$
$\text{[math]}$	$\text{[math]}$	$\text{[math]}$
$\text{[math]}$	$\text{[math]}$	$\text{[math]}$

Agresti-Coull信頼区間は、標準Wald区間と同じ基盤を持ちますが、前者は $\text{[math]}$ の代わりに $\text{[math]}$ を使用します。 $\text{[math]}$ = 0.05である場合、 $\text{[math]}$ の値は2に近くなるため、この区間はAgresti and Coull (1998)が提唱した"成功2と失敗2"を追加するように修正されたWald区間になります。

Jeffreys信頼限界

JEFFREYS binomial-optionを指定すると、FREQプロシジャは二項比率のJeffreys信頼限界を次のように計算します。

$\text{[math]}$

ここで、 $\text{[math]}$ は、形状パラメータ $\text{[math]}$ および $\text{[math]}$ を持つベータ分布の $\text{[math]}$ 番目のパーセント点です。 $\text{[math]}$ の場合、下側信頼限界がゼロに設定され、 $\text{[math]}$ の場合、上側信頼限界が1に設定されます。これは、二項比率に関する無情報Jeffreys事前分布に基づくEqual-tailed区間になります。詳細は、Brown, Cai, and DasGupta (2001)を参照してください。二項比率の推定のためのベータ事前分布に関する詳細は、Berger (1985)を参照してください。

Wilson (スコア)信頼限界

WILSON binomial-optionを指定すると、FREQプロシジャは二項比率のWilson信頼限界を計算します。これらは、スコア信頼限界としても知られており、Wilson (1927)により完成されたものです。この信頼限界は、帰無仮説の分散比を使用した正規検定(スコア検定)の逆に基づいています。Wilson信頼限界は次の根になります。

$\text{[math]}$

これは次のように計算されます。

$\text{[math]}$

Wilson区間は、Wald区間や正確な(Clopper-Pearson)区間よりも高い性能を持つことが証明されています。詳細は、Agresti and Coull (1998)、Brown, Cai, and DasGupta (2001)、Newcombe (1998)を参照してください。

正確な(Clopper-Pearson)信頼限界

二項比率に関する正確な(Clopper-Pearson)信頼限界は、二項分布に基づく等尾部検定を反転することにより構成されます。この方法は、Clopper and Pearson (1934)により完成されたものです。正確な信頼限界 $\text{[math]}$ および $\text{[math]}$ は $\text{[math]}$ において、次の方程式を満足します。

	$\text{[math]}$	$\text{[math]}$	$\text{[math]}$
	$\text{[math]}$	$\text{[math]}$	$\text{[math]}$

$\text{[math]}$ の場合、下側信頼限界は $\text{[math]}$ になり、 $\text{[math]}$ の場合、上側信頼限界は $\text{[math]}$ になります。

FREQプロシジャは、 $\text{[math]}$ 分布を使用して、正確な(Clopper-Pearson)信頼限界を次のように計算します。

	$\text{[math]}$	$\text{[math]}$	$\text{[math]}$
	$\text{[math]}$	$\text{[math]}$	$\text{[math]}$

ここで、 $\text{[math]}$ は、自由度 $\text{[math]}$ および $\text{[math]}$ を持つ $\text{[math]}$ 分布の $\text{[math]}$ 番目のパーセント点です。この式の導出についてはLeemis and Trivedi (1996)を参照してください。正確な二項信頼限界についての詳細は、Collett (1991)を参照してください。

これは離散的な問題であるため、正確な(Clopper-Pearson)信頼区間の信頼係数(包含確率) は、厳密には( $\text{[math]}$ )ではなく、最小で( $\text{[math]}$ )となります。このため、この信頼区間は保守的となります。標本サイズが大きくない場合、実際の包含確率はターゲット値よりも非常に大きくなります。これらの信頼限界に関する詳細は、Coull (1998)、Brown, Cai, and DasGupta (2001)、Leemis and Trivedi (1996)を参照してください。

二項テスト

BINOMIALオプションを指定すると、デフォルトで、二項比率に関する漸近同等性の検定が実施されます。また、binomial-optionsを指定することでも、二項比率に関する非劣性、優越性、同等性の検定を要求できます。EXACTステートメントでBINOMIALオプションを指定すると、FREQプロシジャは、binomial-optionsで要求された検定の正確なp値も計算します。

同等性の検定

FREQプロシジャは、二項比率が $\text{[math]}$ に必要という仮説の漸近検定を計算します。ここで、 $\text{[math]}$ の値を指定するには、P= binomial-optionを使用します。P=にヌル値以外を指定すると、FREQプロシジャはデフォルトで $\text{[math]}$ を使用します。二項検定は次のように計算されます。

$\text{[math]}$

デフォルトでは、標準誤差は、帰無仮説の比率に基づいて次のように計算されます。

$\text{[math]}$

VAR=SAMPLE binomial-optionを指定すると、次のように、標本比率から標準誤差が計算されます。

$\text{[math]}$

CORRECT binomial-optionまたはBINOMIALCオプションを指定すると、FREQプロシジャは、正規近似と離散的な二項分布間の差異を調整するために、漸近検定統計量に連続補正を含めます。詳細は、Fleiss, Levin, and Paik (2003)を参照してください。 $\text{[math]}$ の連続補正は、 $\text{[math]}$ が正数である場合、検定統計量の分子から差し引かれます。

FREQプロシジャは、この検定の片側および両側の $\text{[math]}$ 値を計算します。検定統計量 $\text{[math]}$ がゼロ(帰無仮説の下でのその期待値)より大きい場合、FREQプロシジャは、右側 $\text{[math]}$ 値を計算します。これは、帰無仮説の下で統計量の大きい値が発生する確率になります。小さい右側 $\text{[math]}$ 値は、比率の真の値が $\text{[math]}$ より大きいという対立仮説を支持します。この検定統計量がゼロ以下である場合、FREQプロシジャは、左側 $\text{[math]}$ 値を計算します。これは、帰無仮説の下で統計量の小さな値が発生する確率になります。小さな左側 $\text{[math]}$ 値は、比率の真の値が $\text{[math]}$ り小さいという対立仮説を支持します。片側の $\text{[math]}$ 値 $\text{[math]}$ は次のように計算されます。

$\text{[math]}$

ここで、 $\text{[math]}$ は標準正規分布を持ちます。両側のp値は $\text{[math]}$ のように計算されます。

EXACT ステートメントでBINOMIALオプションを指定すると、FREQプロシジャは、帰無仮説 $\text{[math]}$ の正確な検定も計算します。正確検定を計算する場合、FREQプロシジャは次のような二項確率関数を使用します。

$\text{[math]}$

ここで、変数 $\text{[math]}$ はパラメータ $\text{[math]}$ および $\text{[math]}$ を持つ二項分布に従います。左側p値 $\text{[math]}$ を計算する場合、FREQプロシジャは、 $\text{[math]}$ に関する二項確率を、ゼロから $\text{[math]}$ まで合計します。右側p値 $\text{[math]}$ を計算する場合、FREQプロシジャは、 $\text{[math]}$ に関する二項確率を、 $\text{[math]}$ から $\text{[math]}$ まで合計します。正確な片側p値は、次に示すように、右側および左側p値の最小値となります。

$\text{[math]}$

両側のp値は、 $\text{[math]}$ のように計算されます。

非劣性の検定

NONINF binomial-optionを指定すると、FREQプロシジャは二項比率に関する非劣性の検定を実施します。非劣性の検定の帰無仮説は、次のように表されます。

$\text{[math]}$

対立仮説は次のようになります。

$\text{[math]}$

ここで、 $\text{[math]}$ は非劣性のマージンであり、 $\text{[math]}$ は帰無仮説の比率です。帰無仮説の拒否は、二項比率がヌル値に対して劣性でないことを示します。詳細は、Chow, Shao, and Wang (2003)を参照してください。

$\text{[math]}$ の値を指定するにはMARGIN= binomial-optionを使用します。 $\text{[math]}$ を指定するには、P= binomial-optionを使用します。デフォルトでは、 $\text{[math]}$ および $\text{[math]}$ です。

FREQプロシジャは、非劣性の漸近Wald検定も実施します。検定統計量は次のように計算されます。

$\text{[math]}$

ここで、 $\text{[math]}$ は非劣性限界です。

$\text{[math]}$

デフォルトでは、標準誤差は、標本比率から次のように計算されます。

$\text{[math]}$

VAR=NULL binomial-optionを指定すると、標準誤差は非劣性限界(ヌル比率とマージンにより決定されるもの)に基づいて次のように計算されます。

$\text{[math]}$

CORRECT binomial-optionまたはBINOMIALCオプションを指定すると、FREQプロシジャは、漸近検定統計量 $\text{[math]}$ に連続補正を含めます。 $\text{[math]}$ の連続補正は、 $\text{[math]}$ が正数である場合、検定統計量の分子から差し引かれます。

非劣性のp値は次のようになります。

$\text{[math]}$

ここで、 $\text{[math]}$ は標準正規分布を持ちます。

非劣性分析の一部として、FREQプロシジャは、二項比率に関する漸近Wald信頼限界を計算します。これらの信頼限界は、Wald信頼限界のセクションで示した方法で計算されますが、非劣性検定統計量 $\text{[math]}$ の場合と同じ標準誤差(VAR=NULLまたはVAR=SAMPLE)を使用します。信頼係数は $\text{[math]}$ %です(Schuirmann 1999)。ALPHA=オプションを省略すると、非劣性信頼限界はデフォルトで $\text{[math]}$ %の信頼限界となります。この信頼限界を非劣性の限界 $\text{[math]}$ と比較できます。

EXACTステートメントでBINOMIALオプションを指定すると、FREQプロシジャは、帰無仮説に関する非劣性の検定も計算します。正確なp値は、パラメータ $\text{[math]}$ および $\text{[math]}$ 値を持つ二項確率関数を使用して次のように計算されます。

$\text{[math]}$

詳細は、Chow, Shao, Wang (2003, p. 116)を参照してください。正確な二項統計量を要求する場合、FREQは、同等性分析の表示の中に、二項比率に関する正確な(Clopper-Pearson)信頼限界も含めます。詳細は、正確な(Clopper-Pearson)信頼限界のセクションを参照してください。

優越性の検定

SUP binomial-optionを指定すると、FREQプロシジャは、二項比率に関する優越性の検定を実施します。優越性の検定の帰無仮説は、次のように表されます。

$\text{[math]}$

対立仮説は次のようになります。

$\text{[math]}$

ここで、 $\text{[math]}$ は非劣性のマージンであり、 $\text{[math]}$ はヌル比率です。帰無仮説の拒否は、二項比率がヌル値に対して優越していることを示します。 $\text{[math]}$ の値を指定するにはMARGIN=binomial-optionを使用します。 $\text{[math]}$ の値を指定するには、P= binomial-optionを使用します。デフォルトでは、 $\text{[math]}$ および $\text{[math]}$ です。

優越性分析は非劣勢分析と同じですが、帰無仮説で正のマージン値 $\text{[math]}$ を使用するところが違います。優越性限界は $\text{[math]}$ に等しくなります。優越性の計算は非劣性の検定のセクションに示されている方法に従いますが、– $\text{[math]}$ の代わりに $\text{[math]}$ を使用します。詳細は、Chow, Shao, and Wang (2003)を参照してください。

同等性の検定

EQUIV binomial-optionを指定すると、FREQプロシジャは、二項比率に関する同等性の検定を実施します。同等性の検定の帰無仮説は、

$\text{[math]}$

対立仮説は次のようになります。

$\text{[math]}$

ここで、 $\text{[math]}$ は下側マージン、 $\text{[math]}$ は上側マージン、 $\text{[math]}$ はヌル比率です。帰無仮説の拒否は、二項比率がヌル値に対して同等であることを示します。詳細は、Chow, Shao, and Wang (2003)を参照してください。

マージン値 $\text{[math]}$ および $\text{[math]}$ を指定するには、MARGIN= binomial-optionを使用します。MARGIN=を指定しない場合、FREQプロシジャはデフォルトの下限マージンおよび上限マージンとして、それぞれ–0.2および0.2を使用します。単一のマージン値 $\text{[math]}$ を指定すると、FREQプロシジャはデフォルトの下限マージンおよび上限マージンとして、それぞれ $\text{[math]}$ および $\text{[math]}$ を使用します。ヌル比率 $\text{[math]}$ を指定するには、P= binomial-optionを使用します。デフォルトでは、 $\text{[math]}$ になります。

FREQプロシジャは、同等性の分析で、2つの片側検定(TOST)を計算します (Schuirmann 1987)。TOSTアプローチには、下側マージンに関する右側検定と、上側マージンに関する左側検定が含まれます。全体的なp値は、下限および上限の検定における2つのp値のうちの大きい方になります。

下側マージンの場合、漸近Wald検定統計量は次のように計算されます。

$\text{[math]}$

ここで、下側同等性限界は次のようになります。

$\text{[math]}$

デフォルトでは、標準誤差は、標本母集団から次のように計算されます。

$\text{[math]}$

VAR=NULL binomial-optionを指定すると、標準誤差は下側同等性限界(ヌル比率と下側マージンにより決定されるもの)に基づいて次のように計算されます。

$\text{[math]}$

CORRECT binomial-optionまたはBINOMIALCオプションを指定すると、FREQプロシジャは、漸近検定統計量 $\text{[math]}$ に連続補正を含めます。 $\text{[math]}$ の連続補正は、検定統計量 $\text{[math]}$ の分子が正数である場合、同分子から差し引かれます。それ以外の場合、連続補正は同分子に追加されます。

下側マージン検定のp値は次のようになります。

$\text{[math]}$

上側マージンの漸近検定も同様に計算されます。Wald検定統計量は次のように表されます。

$\text{[math]}$

ここで、上側同等性限界は次のようになります。

$\text{[math]}$

デフォルトでは、標準誤差は、標本母集団から計算されます。VAR=NULL binomial-optionを指定すると、標準誤差は上側同等性限界に基づいて次のように計算されます。

$\text{[math]}$

CORRECT binomial-optionまたはBINOMIALCオプションを指定すると、FREQプロシジャは、漸近検定統計量 $\text{[math]}$ に連続補正 $\text{[math]}$ を含めます。

上側マージン検定のp値は次のようになります。

$\text{[math]}$

両側検定(TOST)に基づく場合、同等性の検定の全体的なp値は、下側および上側マージン検定のp値以上になります。これは次のように表されます。

$\text{[math]}$

同等性分析の一部として、FREQプロシジャは、二項比率に関する漸近Wald信頼限界を計算します。これらの信頼限界は、Wald信頼限界のセクションで示した方法で計算されますが、同等性検定統計量の場合と同じ標準誤差(VAR=NULLまたはVAR=SAMPLE)を使用し、 $\text{[math]}$ %の信頼係数を持ちます(Schuirmann 1999)。ALPHA=を省略すると、これらはデフォルトで $\text{[math]}$ %の信頼限界になります。VAR=NULLを指定すると、下側および上側マージン検定で、それぞれヌル比率と対応する(下側または上側)マージンに基づいて、別々の標準誤差が計算されます。これらの信頼限界は、これらの2つの標準誤差の最大値を使用して計算されます。信頼限界を同等性の限界 $\text{[math]}$ と比較できます。

EXACTステートメントでBINOMIALオプションを指定すると、FREQプロシジャは、両側正確検定(TOST)を使用した正確な等々性の検定も実施します。同プロシジャは、非劣性の検定のセクションに示されている二項確率関数を使用して上側および下側マージンの正確検定を計算します。同等性の検定に関する全体的な正確なp値は、下側および上側マージンの正確検定におけるp値の大きい方になります。正確な検定を要求する場合、FREQプロシジャは、同等性分析の表示に正確な(Clopper-Pearson)信頼限界も含めます。信頼係数は $\text{[math]}$ %です(Schuirmann 1999)。詳細は、正確な(Clopper-Pearson)信頼限界のセクションを参照してください。