例3.6 カイ2乗統計量の出力データセット

この例では、例3.1に示されているColorデータセットを使って、Pearsonカイ2乗統計量と尤度比カイ2乗統計量をSASデータセットに出力します。次のPROC FREQステートメントは、眼の色と髪の色に関する2元表を作成します。

proc freq data=Color order=data;
   tables Eyes*Hair / expected cellchi2 norow nocol chisq;
   output out=ChiSqData n nmiss pchi lrchi;
   weight Count;
   title 'Chi-Square Tests for 3 by 5 Table of Eye and Hair Color';
run;
proc print data=ChiSqData noobs;
   title1 'Chi-Square Statistics for Eye and Hair Color';
   title2 'Output Data Set from the FREQ Procedure';
run;

EXPECTEDオプションは、期待されるセル度数をクロス集計表に表示します。CELLCHI2オプションは、全体的なカイ2乗統計量に対する各セルの寄与分を表示します。またNOROWオプションおよびNOCOLオプションが指定されているため、行と列のパーセントがクロス集計表に表示されません。CHISQオプションはカイ2乗検定を実施します。

OUTPUTステートメントは、ChiSqData出力データセットを作成すると共に、同データセットに含める統計量を指定します。Nオプションは、欠損値でないオブザベーションの数を要求します。NMISSオプションは欠損値でないオブザベーションの数を保存します。PCHIおよびLRCHIの各オプションは、それぞれPearsonカイ2乗および尤度比カイ2乗統計量を、それらの自由度および値と共に要求します。

上記のステートメントの出力は、出力3.6.1および出力3.6.2になります。出力3.6.1の分割表には、眼の色と髪の色に関する値が、Colorデータセット内にそれらが現れるのと同じ順番で表示されます。出力3.6.2のPearsonカイ2乗統計量は、眼の色と髪の色の間の連関性の根拠(=0.0073)を提供します。このセルのカイ2乗値は、ほとんどの連関性は、目の色がgreenの子供は髪の色がfairまたはredである場合が多く、髪の色がdarkまたはblackである場合は少ないという理由に起因していることを示しています。眼の色がbrownである子供に関しては、上記の逆が成り立ちます。

出力3.6.3に、OUTPUTステートメントが作成する出力データセットを示します。このデータセットには、標本サイズを含んでいる1つのオブザベーション、欠損値の数、カイ2乗統計量とその自由度および値が含まれています(出力3.6.2を参照)。

出力3.6.1 分割表
Chi-Square Tests for 3 by 5 Table of Eye and Hair Color

The FREQ Procedure

Frequency
Expected
Cell Chi-Square
Percent
Table of Eyes by Hair
Eyes(Eye Color) Hair(Hair Color)
fair red medium dark black Total
blue
69
66.425
0.0998
9.06
28
32.921
0.7357
3.67
68
63.22
0.3613
8.92
51
53.024
0.0772
6.69
6
6.4094
0.0262
0.79
222
 
 
29.13
green
69
59.543
1.5019
9.06
38
29.51
2.4422
4.99
55
56.671
0.0492
7.22
37
47.53
2.3329
4.86
0
5.7454
5.7454
0.00
199
 
 
26.12
brown
90
102.03
1.4187
11.81
47
50.568
0.2518
6.17
94
97.109
0.0995
12.34
94
81.446
1.935
12.34
16
9.8451
3.8478
2.10
341
 
 
44.75
Total
228
29.92
113
14.83
217
28.48
182
23.88
22
2.89
762
100.00

出力3.6.2 カイ2乗統計量
Statistic DF Value Prob
Chi-Square 8 20.9248 0.0073
Likelihood Ratio Chi-Square 8 25.9733 0.0011
Mantel-Haenszel Chi-Square 1 3.7838 0.0518
Phi Coefficient   0.1657  
Contingency Coefficient   0.1635  
Cramer's V   0.1172  

出力3.6.3 出力データセット
Chi-Square Statistics for Eye and Hair Color
Output Data Set from the FREQ Procedure

N NMISS _PCHI_ DF_PCHI P_PCHI _LRCHI_ DF_LRCHI P_LRCHI
762 0 20.9248 8 .007349898 25.9733 8 .001061424