度数カウントの入力

FREQプロシジャは、生データやセルカウントデータを使用して、度数表やクロス集計表を作成します。生データとは、ケースレコードデータとも呼ばれ、1つのサブジェクトや標本メンバにつき1つのレコードとしてデータを報告するものです。セルカウントデータとは、データ値のすべての可能な組み合わせを度数カウント共に示す表としてデータを報告するものです。この方式によるデータの表示は、印刷結果として頻繁に使用されます。

次のDATAステップステートメントは、生データをSASデータセットに格納します。

data Raw;
   input Subject $ R C @@;
   datalines;
01 1 1  02 1 1  03 1 1  04 1 1  05 1 1
06 1 2  07 1 2  08 1 2  09 2 1  10 2 1
11 2 1  12 2 1  13 2 2  14 2 2  14 2 2
;

同じデータをセルカウントとして格納するには、次のDATAステップステートメントを使用します。

data CellCounts;
   input R C Count @@;
   datalines;
1 1 5   1 2 3
2 1 4   2 2 3
;

変数Rには行の値が、変数Cには列の値が含まれます。変数Countには、行と列の各組み合わせに対応するセルカウントが含まれます。

RawデータセットとCellCountsデータセットはどちらも、まったく同じ度数カウント、2元表、および統計量を生成します。CellCountsデータセットを使用する場合、変数Countにすべてのセルカウントを含めるように指定するWEIGHTステートメントを含める必要があります。たとえば、次のFREQステートメントでは、CellCountsデータセットを使用して2元クロス集計表を作成します。

proc freq data=CellCounts;
   tables R*C;
   weight Count;
run;