UNIVARIATEプロシジャ

 
ラインプリンタプロットの作成

PROC UNIVARIATEプロシジャのPLOTSオプションでは、最大4つの診断ラインプリンタプロットを作成して、データ分布を調べることができます。これらのプロットは、幹葉プロット(横棒チャート)、箱ひげ図、正規確率プロット、横に並べた箱ひげ図です。WEIGHTステートメントを指定すると、PROC UNIVARIATEは重み付きヒストグラム、重み付き分位点に基づく重み付き箱ひげ図および重み付き正規確率プロットを作成します。

これらのプロットは、旧バージョンのSASのUNIVARIATEプロシジャの従来的な機能です。高解像度グラフを表示できるCDFPLOT、HISTOGRAM、PPPLOT、PROBPLOT、QQPLOTステートメントが追加される以前からあります。また、PLOTSオプションで要求したラインプリンタプロットは、主にODS LISTINGの出力先で使用されることを想定しています。例4.5を参照してください。

幹葉プロット

出力の最初のプロットは、幹葉プロット(Tukey; 1977)または横棒チャートのいずれかです。単一の間隔に49個を超えるオブザベーションが含まれる場合は、横棒チャートが表示されます。それ以外の場合は、幹葉プロットが表示されます。幹葉プロットと横棒チャートは、いずれもデータ分布全体を視覚化する方法を提供する点で似ています。幹葉プロットではプロット内の各ポイントで個別のデータ値が示されるため、より詳細な情報が得られます。

プロットで表示する幹の数を変更するには、PLOTSIZE=を使用して行数を増減します。プロットの下に表示される説明に、変数の値の決定方法が記載されています。説明が表示されない場合、Stem.Leafに1を乗じて変数の値を決定します。たとえば、幹の値が10で葉の値が1の場合、変数値は約10.1です。幹葉プロットでは、変数値は最も近い葉に丸められます。変数値が2つの葉のちょうど真ん中にある場合は、最も近い偶数の整数値の葉に丸められます。たとえば、変数値が3.15の場合、幹の値は3で葉の値は2です。

箱ひげ図

箱ひげ図(またはスキマティックボックスプロット)は、幹葉プロットの隣に表示されます。いずれのプロットも同じ垂直軸を使用します。箱ひげ図では、データの要約を視覚的に表示し、外れ値を特定することができます。箱の上下の辺は、標本の25番目(Q1)のパーセント点と75番目(Q3)のパーセント点に対応します。箱の長さは1つの四分位範囲(Q3 – Q1)です。終点にアスタリスクが付いた中央の水平線は、標本の中央値に対応します。中央のプラス記号(+)は、標本平均に対応します。平均値と中央値が等しい場合、プラス記号は箱の中の線上に示されます。箱から突き出た垂直線(ひげと言います)はデータが広がる範囲まで伸び、四分位範囲の1.5倍の距離が最長です。これより離れた値は潜在的な外れ値です。極値には0またはアスタリスク(*)が表示されます。0が表示される場合は、箱の上辺または下辺からの距離が四分位範囲の1.5~3倍の値です。 アスタリスクが表示される場合は、さらに外れた値です。

:高解像度グラフを使用する箱ひげ図を作成するには、SAS/STATソフトウェアのBOXPLOTプロシジャを使用します。Chapter 25, The BOXPLOT Procedure (SAS/STAT User's Guide)を参照してください。

正規確率プロット

正規確率プロットは、経験分位点を標準正規分布の分位点に対してプロットします。アスタリスク(*)はデータ値を示します。プラス記号(+)は、標本平均および標準偏差を使用して描画される直線の参照線です。正規分布のデータの場合、アスタリスクは参照線に沿ってプロットされやすくなります。垂直座標はデータ値で、水平座標はです。

     

重み付き正規確率プロットの場合、番目の並べ替えられたオブザベーションは、に対してプロットされます。

     

各オブザベーションの重みが同じ場合、となり、の計算式は重み付けのない正規確率プロットのの式に短縮されます。

     

VARDEF=の値がWDFまたはWEIGHTである場合、切片が、傾きがの参照線がプロットに追加されます。VARDEF=の値がDFまたはNである場合、傾きはです。は平均の重みです。

各オブザベーションの重みが同じで、VARDEF=の値がDF、NまたはWEIGHTである場合、参照線は重み付けのない正規確率プロットの通常の参照線(切片が、傾きが)になります。

平均が、標準偏差がの正規分布のデータで、各オブザベーションの重みが同じである場合、プロット上のポイントはほぼ直線状に並びます。この線の切片はです。VARDEF=がWDFまたはWEIGHTの場合の傾きは、VARDEF=がDFまたはNの場合の傾きはです。

:高解像度の確率プロットを作成するには、PROC UNIVARIATEのPROBPLOTステートメントを使用します。PROBPLOTステートメントのセクションを参照してください。

横に並べた箱ひげ図

BYステートメントでPLOTオプションを使用すると、PROC UNIVARIATEは横に並べた箱ひげ図をBYグループごとに1つずつ作成します。箱ひげ図(またはスキマティックプロット)は共通の尺度を使用します。このため、複数のBYグループにわたってデータ分布を比較できます。このプロットは、すべてのBYグループの単変量分析後に表示されます。このプロットを抑制するには、NOBYPLOTオプションを使用します。

:高解像度の横に並べた箱ひげ図を作成するには、SAS/STATソフトウェアのBOXPLOTプロシジャを使用します。Chapter 25, The BOXPLOT Procedure (SAS/STAT User's Guide)を参照してください。