Hoeffding従属係数

Hoeffdingの従属統計量は、より一般的な独立性からのずれを測る、連関性についてのノンパラメトリックな統計量です。Hoeffdingの縦続統計量は、2×2分類表からカイ2乗統計量を求め、そのカイ2乗統計量を重み付けして合計した値の近似になります(Hoeffding 1948)。各値は、分類のカットポイントとなります。Hoeffdingのは次の式で表されます。

     

ここで、です。の順位、の順位で、 (2変量順位とも呼ぶ)は、番目の点のおよび値よりも小さい値を持つ点の数に1を加えたものです。

値または値に関してのみ結合されている点は、の2分の1になります(もう一方の値が、番目の点の対応する値よりも小さい場合)。

およびの両方に関して結合されている点は、の4分の1になります。CORRプロシジャは、まずデータを順位付けすることにより値を取得します。続いて、最初の変数の値でオブザベーションを順位付けした後、2番目の変数の値でオブザベーションを順位付けすることにより、データが二重に並べ替えられます。Hoeffdingの統計量は、最初の変数の交換数を使って計算されます。データセットのオブザベーション間で結合が起こらない場合、統計量の値は0.5~1の間になります(1は完全従属を意味する)。一方、結合が起こる場合、統計量の値はより小さい値になります。すなわち、変数のペアが同じ値を持つ場合、Hoeffdingの統計量は1よりも小さい値になります。小規模なデータセットで多くの結合が起こる場合、統計量は0.5未満になります。Hoeffdingのの詳細は、Hollander and Wolfe (1999)を参照してください。

確率値

Hoeffdingの統計量は、Blum, Kiefer, and Rosenblatt (1961)により計算された漸近分布を使用して計算されます。公式は次の通りです。

     

これは漸近分布から導かれます。標本サイズが10未満である場合、Hollander and Wolfe (1999)の分布の表を参照してください。