例3.5 2x2分割表の分析

この例では、2種類の食習慣における冠状動脈性心臓病の発症リスクを比較するために、カイ2乗検定とFisherの正確な検定を計算します。また、相対リスクを推定し、オッズ比に関する正確な信頼限界も計算します。

データセットFatCompには、高脂肪食と冠状動脈性心臓病の発症リスクに関するケースコントロールスタディの仮説データが含まれています。これらのデータはセルカウントとして記録されるため、変数Countには、曝露量と反応の組み合わせごとの度数が含められます。このデータセットは、変数ExposureおよびResponseに基づいて降順で並べ替えられているため、表の最初のセルには正の曝露と正の反応の組み合わせの度数が含められます。次のFORMATプロシジャは、曝露量と反応のタイプを文字値で識別するための出力形式を作成します。

proc format;
   value ExpFmt 1='High Cholesterol Diet'
                0='Low Cholesterol Diet';
   value RspFmt 1='Yes'
                0='No';
run;
data FatComp;
   input Exposure Response Count;
   label Response='Heart Disease';
   datalines;
0 0  6
0 1  2
1 0  4
1 1 11
;
proc sort data=FatComp;
   by descending Exposure descending Response;
run;

次のPROC FREQステートメントでは、ORDER=DATAオプションにより、入力データセット内の順番に従って分割表の値を配置するよう指示しています。 TABLESステートメントは、行がExposureで列がResponseの2元表を要求します。CHISQオプションは、複数のカイ2乗検定を要求します。RELRISKオプションは、相対リスク統計量を生成します。EXACTステートメントは、正確なPearsonカイ2乗検定と、オッズ比に関する信頼限界を要求します。

proc freq data=FatComp order=data;
   format Exposure ExpFmt. Response RspFmt.;
   tables Exposure*Response / chisq relrisk;
   exact pchi or;
   weight Count;
   title 'Case-Control Study of High Fat/Cholesterol Diet';
run;

出力3.5.1の分割表には変数値が示されており、最初の表セルにはデータセット内の最初のセルの度数(正の曝露量と正の応答の組み合わせの度数)が含められます。

出力3.5.1 分割表
Case-Control Study of High Fat/Cholesterol Diet

The FREQ Procedure

Frequency
Percent
Row Pct
Col Pct
Table of Exposure by Response
Exposure Response(Heart Disease)
Yes No Total
High Cholesterol Diet
11
47.83
73.33
84.62
4
17.39
26.67
40.00
15
65.22
 
 
Low Cholesterol Diet
2
8.70
25.00
15.38
6
26.09
75.00
60.00
8
34.78
 
 
Total
13
56.52
10
43.48
23
100.00

出力3.5.2にカイ2乗統計量を示します。一部の表セルの期待カウントは小さいため、FREQプロシジャは、漸近カイ2乗検定は適切でないという警告を表示します。この場合、正確な検定の方が適しています。この分析の対立仮説は、冠状動脈性心臓病は高脂肪食と連関している可能性が高いというものであるため、片側検定を実施する必要があります。Fisherの正確な右側検定は、高脂肪食グループにおける心臓病の発症率が低脂肪食グループにおける心臓病の発症率を超えているかどうかを分析します。この値は小さいため、対立仮説が支持されます。

出力3.5.3に示されているオッズ比は、事象が稀である場合の相対リスクの推定値を表します。この推定値は、心臓病のオッズが、高脂肪食グループでは8.25倍に高まることを示しています 。ただし、信頼限界が広いことは、この推定値の精度が低いことを意味します。

出力3.5.2 カイ2乗統計量
Statistic DF Value Prob
Chi-Square 1 4.9597 0.0259
Likelihood Ratio Chi-Square 1 5.0975 0.0240
Continuity Adj. Chi-Square 1 3.1879 0.0742
Mantel-Haenszel Chi-Square 1 4.7441 0.0294
Phi Coefficient   0.4644  
Contingency Coefficient   0.4212  
Cramer's V   0.4644  
WARNING: 50% of the cells have expected counts less than 5.
(Asymptotic) Chi-Square may not be a valid test.

Pearson Chi-Square Test
Chi-Square 4.9597
DF 1
Asymptotic Pr > ChiSq 0.0259
Exact Pr >= ChiSq 0.0393

Fisher's Exact Test
Cell (1,1) Frequency (F) 11
Left-sided Pr <= F 0.9967
Right-sided Pr >= F 0.0367
   
Table Probability (P) 0.0334
Two-sided Pr <= P 0.0393

出力3.5.3 相対リスク
Estimates of the Relative Risk (Row1/Row2)
Type of Study Value 95% Confidence Limits
Case-Control (Odds Ratio) 8.2500 1.1535 59.0029
Cohort (Col1 Risk) 2.9333 0.8502 10.1204
Cohort (Col2 Risk) 0.3556 0.1403 0.9009

Odds Ratio (Case-Control Study)
Odds Ratio 8.2500
   
Asymptotic Conf Limits  
95% Lower Conf Limit 1.1535
95% Upper Conf Limit 59.0029
   
Exact Conf Limits  
95% Lower Conf Limit 0.8677
95% Upper Conf Limit 105.5488