出力データセット

FREQプロシジャは、その他の統計およびレポート作成プロシジャで使用できる、2種類の出力データセットを作成します。これらのデータセットを要求するには次のようにします。

  • TABLESステートメントのOUT=オプションを指定します。これにより、度数表やクロス集計表のカウントやパーセンテージを含む出力データセットが作成されます。

  • OUTPUTステートメントを指定します。これにより、統計量を含む出力データセットが作成されます。

FREQプロシジャは出力データセットを表示しません。出力データセットを表示するには、PRINTプロシジャ、REPORTプロシジャ、またはその他のSASレポート作成ツールを使用します。

これらの2種類のデータセットに加えて、アウトプットデリバリシステム(ODS)を使用することで、任意のFREQプロシジャ出力の断片からSASデータセットを作成できます。詳細は、ODSテーブル名のセクションを参照してください。

TABLESステートメントの出力データセットの内容

TABLESステートメントのOUT=オプションは、最後の表の要求における変数値(または表セル)の組み合わせごとに1つのオブザベーションを含むSASデータセットを作成します。デフォルトでは、各オブザベーションには、特定の表セルの度数やパーセンテージが含まれます。入力データセットに欠損値が含まれている場合、出力データセットにも、欠損値の度数を持つオブザベーションが含まれます。出力データセットには次の変数が含まれます。

  • BY変数

  • 表要求変数。表要求A*B*C*DにおけるABCDに相当します。

  • COUNT。表セルの度数を含む変数です。

  • PERCENT。表セルのパーセンテージを含む変数です。

2元表または多次元クロス表に対してTABLESステートメントでOUTEXPECTオプションを指定すると、出力データセットには期待される度数も含められます。2元表または多次元クロス表に対してOUTPCTオプションを指定すると、出力データセットには行、列、表のパーセンテージも含められます。追加される変数は次のとおりです。

  • EXPECTED。期待される度数を含む変数です。

  • PCT_TABLn元表()の場合、二元度数表のパーセンテージを含む変数です。

  • PCT_ROW。行度数のパーセンテージを含む変数です。

  • PCT_COL。列度数のパーセンテージを含む変数です。

1元表に対してTABLESステートメントでOUTCUMオプションを指定すると、出力データセットには累積度数と累積パーセンテージも含められます。追加される変数は次のとおりです。

  • CUM_FREQ。累積度数を含む変数です。

  • CUM_PCT。累積パーセンテージを含む変数です。

OUTCUMオプションは、2元表や多次元クロス表には効果がありません。

次のFREQステートメントは、度数とパーセンテージを含む出力データセットを作成します。

    proc freq;
       tables A A*B / out=D;
    run;

出力データセットDには、行がAで列がBの表の度数とパーセンテージが含まれます。この表は、TABLESステートメントにリストされた最後の表要求に対応します。Aが2つのレベル(1と2)を持ち、Bが3つのレベル(1、2、3)を持ち、かつゼロまたは欠損値の表セルが存在しない場合、出力データセットDには、6個のオブザベーション(ABの各レベルの組み合わせごとに1つのオブザベーション)が含まれます。最初のオブザベーションはA=1およびB=1に対応、2番目のオブザベーションはA=1およびB=2に対応、という具合になります。このデータセットには、変数COUNTおよびPERCENTが含まれます。COUNTの値は、ABのレベルの指定の組み合わせを含むオブザベーションの数になります。PERCENTの値は、そのABの組み合わせを含むオブザベーションの合計数になります。

FREQが異なる変数値を同じフォーマットされたレベルへと結合する場合、出力データセットには、フォーマットされたレベルの最小内部値が含まれます。たとえば、変数Xが値1.1、1.4、1.7、2.1、2.3を持つとします。この場合、PROC FREQステートメント内で次のステートメントをサブミットすると、

    format X 1.;

Xの度数表にリストされるフォーマットされたレベルは、1と2になります。度数カウントを含む出力データセットを作成すると、Xのレベルの内部値は1.1と1.7になります。出力データセットを表示する場合にXの内部値を報告するには、Xの出力形式として3.1を使用します。

OUTPUTステートメントの出力データセットの内容

OUTPUTステートメントは、FREQプロシジャが最後の表要求に関して計算した統計量を含むSASデータセットを作成します。出力データセットに含める統計量はユーザが指定します。各層または各2元表につき、指定された統計量を含む1つのオブザベーションが存在します。FREQプロシジャが層化された表に関する要約統計量を計算する場合、出力データセットには、これらの統計量を含む1つの要約オブザベーションも含められます。

出力データセットには次の変数が含まれます。

  • BY変数

  • 層を識別する変数。表要求A*B*C*DにおけるAB に相当します

  • 指定された統計量を含む変数

出力データセットには、指定された統計量に関してFREQプロシジャがこれらの値を計算する場合には、p値と自由度、漸近標準誤差(ASE)、信頼限界も含まれます。

出力データセット内で指定の統計量を含む変数の名前は、下線で囲まれたオプションの名前になります。FREQプロシジャは、対応するp値、自由度、信頼限界を含む変数名を、次のリストに示されている適切な接頭語を持つオプション名を組み合わせることにより形成します。

DF_

自由度

E_

漸近標準誤差(ASE)

L_

下側信頼限界

U_

上側信頼限界

E0_

帰無仮説の下でのASE

Z_

標準化された値

P_

p

P2_

両側のp

PL_

左側のp

PR_

右側のp

XP_

正確なp

XP2_

正確な両側のp

XPL_

正確な左側のp

XPR_

正確な右側のp

XPT_

正確な点確率

XL_

正確な下側信頼限界

XU_

正確な上側信頼限界

たとえば、Pearsonカイ2乗統計量、その自由度、およびその値に関して作成される変数名は、それぞれ_PCHI_DF_PCHIP_PCHIになります。

接頭語に統計オプション名を加えた長さが8文字を超える場合、FREQは新しい変数の名前が8文字になるようにオプション名を切り詰めます。