UNIVARIATEプロシジャ

INSETステートメント

  • INSET keywords </ options>;

INSETステートメントは、CDFPLOTHISTOGRAMPPPLOTPROBPLOTQQPLOT のいずれかのステートメントで作成されたグラフ内に直接、インセットと呼ばれる要約統計量のボックスまたはテーブルを配置します。INSETステートメントは、拡張したいプロットを作成するプロットステートメントの後に使用する必要があります。インセットは、前のプロットステートメントが作成するすべてのグラフに表示されます。

プロットステートメントの後に複数のINSETステートメントを使用すると、複数のインセットをプロットに挿入できます。例4.17を参照してください。

INSETステートメントには、インセットに表示する情報を特定するキーワードを1つ以上指定します。情報はキーワードの要求順に表示されます。次のキーワードを指定できます。

  • 統計キーワード

  • 1次キーワード

  • 2次キーワード

統計キーワード

利用できる統計キーワードを表4.10に示します。

表4.10: 統計キーワード

キーワード

説明

記述統計キーワード

CSS

修正済み平方和

CV

変動係数

GEOMEAN

幾何平均

KURTOSIS|KURT

尖度

MAX

最大値

MEAN

標本平均

MIN

最小値

MODE

最も度数の高い値

N

標本サイズ

NEXCL

MAXNBIN=またはMAXSIGMAS=オプションによって除外されるオブザベーションの数

NMISS

欠損値の数

NOBS

オブザベーションの数

RANGE

範囲

SKEWNESS|SKEW

歪度

STD | STDDEV

標準偏差

STDMEAN | STDERR

平均の標準誤差

SUM

オブザベーションの合計

SUMWGT

重みの合計

USS

無修正平方和

VAR

分散

パーセント点統計キーワード

P1

1番目のパーセント点

P5

5番目のパーセント点

P10

10番目のパーセント点

Q1

 

P25

下位四分位点(25番目のパーセント点)

MEDIAN

 

Q2

 

P50

中央値(50番目のパーセント点)

Q3

 

P75

上位四分位点(75番目のパーセント点)

P90

90番目のパーセント点

P95

95番目のパーセント点

P99

99番目のパーセント点

QRANGE

四分位範囲(Q3–Q1)

分布によらないパーセント点の信頼限界に関するキーワード (CIPCTLDFオプション)

P1_LCL_DF

1番目のパーセント点の下側信頼限界

P1_UCL_DF

1番目のパーセント点の上側信頼限界

P5_LCL_DF

5番目のパーセント点の下側信頼限界

P5_UCL_DF

5番目のパーセント点の上側信頼限界

P10_LCL_DF

10番目のパーセント点の下側信頼限界

P10_UCL_DF

10番目のパーセント点の上側信頼限界

Q1_LCL_DF

 

P25_LCL_DF

下位四分位点(25番目のパーセント点)の下側信頼限界

Q1_UCL_DF

 

P25_UCL_DF

下位四分位点(25番目のパーセント点)の上側信頼限界

MEDIAN_LCL_DF

 

Q2_LCL_DF

 

P50_LCL_DF

中央値(50番目のパーセント点)の下側信頼限界

MEDIAN_UCL_DF

 

Q2_UCL_DF

 

P50_UCL_DF

中央値(50番目のパーセント点)の上側信頼限界

Q3_LCL_DF

 

P75_LCL_DF

上位四分位点(75番目のパーセント点)の下側信頼限界

Q3_UCL_DF

 

P75_UCL_DF

上位四分位点(75番目のパーセント点)の上側信頼限界

P90_LCL_DF

90番目のパーセント点の下側信頼限界

P90_UCL_DF

90番目のパーセント点の上側信頼限界

P95_LCL_DF

95番目のパーセント点の下側信頼限界

P95_UCL_DF

95番目のパーセント点の上側信頼限界

P99_LCL_DF

99番目のパーセント点の下側信頼限界

P99_UCL_DF

99番目のパーセント点の上側信頼限界

正規分布を仮定した場合のパーセント点の信頼限界に関するキーワード (CIPCTLNORMALオプション)

P1_LCL

1番目のパーセント点の下側信頼限界

P1_UCL

1番目のパーセント点の上側信頼限界

P5_LCL

5番目のパーセント点の下側信頼限界

P5_UCL

5番目のパーセント点の上側信頼限界

P10_LCL

10番目のパーセント点の下側信頼限界

P10_UCL

10番目のパーセント点の上側信頼限界

Q1_LCL

 

P25_LCL

下位四分位点(25番目のパーセント点)の下側信頼限界

Q1_UCL

 

P25_UCL

下位四分位点(25番目のパーセント点)の上側信頼限界

MEDIAN_LCL

 

Q2_LCL

 

P50_LCL

中央値(50番目のパーセント点)の下側信頼限界

MEDIAN_UCL

 

Q2_UCL

 

P50_UCL

中央値(50番目のパーセント点)の上側信頼限界

Q3_LCL

 

P75_LCL

上位四分位点(75番目のパーセント点)の下側信頼限界

Q3_UCL

 

P75_UCL

上位四分位点(75番目のパーセント点)の上側信頼限界

P90_LCL

90番目のパーセント点の下側信頼限界

P90_UCL

90番目のパーセント点の上側信頼限界

P95_LCL

95番目のパーセント点の下側信頼限界

P95_UCL

95番目のパーセント点の上側信頼限界

P99_LCL

99番目のパーセント点の下側信頼限界

P99_UCL

99番目のパーセント点の上側信頼限界

ロバスト統計量キーワード

GINI

Giniの平均差

MAD

中央絶対偏差

QN

$Q_ n$、MADの代替

SN

$S_ n$、MADの代替

STD_GINI

Giniの標準偏差

STD_MAD

MAD標準偏差

STD_QN

$Q_ n$標準偏差

STD_QRANGE

四分位範囲標準偏差

STD_SN

$S_ n$標準偏差

仮説検定キーワード

MSIGN

符号統計量

NORMALTEST

正規性の検定

PNORMAL

正規性の検定の確率値

SIGNRANK

符号付き順位統計量

PROBM

符号検定でのより大きな絶対値の確率

PROBN

正規性の検定の確率値

PROBS

符号付き順位検定の確率値

PROBT

スチューデントのt検定の確率値

T

スチューデントのt検定の統計量

入力データセットの読み取りに関するキーワード

DATA=

入力データセットの(ラベル、値の)ペア


完全にカスタマイズされたインセットを作成するには、DATA=データセットを使用します。

DATA=SAS-data-set

UNIVARIATEプロシジャで、SASデータセットのカスタマイズされた統計をインセットテーブルに表示するよう要求します。データセットには、次の2つの変数を含める必要があります。

_LABEL_

インセットエントリのラベルの値を保存する文字列変数

_VALUE_

インセットエントリの値を保存する文字変数または数値変数

データセット内の各オブザベーションのラベルと値は、インセット内の各行に対応しています。キーワードリスト内のDATA=キーワードの位置によって、インセット内の行の位置が決まります。

1次および2次キーワード

1次キーワードは、当てはめる分布を指定します。これは、パラメトリック法の分布または核密度推定のいずれかになります。 1次キーワードに続いて2次キーワードをかっこで囲んで指定することで、分布に関連付けられている特定の統計量を要求できます。

: 従来的なグラフ出力を生成する場合、2次キーワードなしで1次キーワードを指定すると、色付きの線や、分布名を密度曲線のキーとして表示できます。

HISTOGRAMステートメントでは、当てはめる分布を同じファミリから複数(たとえば2つの正規分布など)を要求できます。1次キーワードの直後に曲線のインデックスを角かっこで囲んで指定することにより、個々の曲線に対応するインセット統計量を表示できます。

次のステートメントは、3つの当てはめた正規曲線を表示し、さらに2番目の曲線に関してのみ適合度統計量を含むインセットを表示します。

proc univariate data=score;
   histogram final / normal(sigma=1 2 3);
   inset normal[2](ad adpval);
run;

表4.11に、1次キーワードと、それらを指定できるプロットステートメントを示します。

表4.11: 1次キーワード

キーワード

分布

使用できるプロットステートメント

BETA

BETA

すべてのプロットステートメント

EXPONENTIAL

指数

すべてのプロットステートメント

GAMMA

GAMMA

すべてのプロットステートメント

GUMBEL

Gumbel

すべてのプロットステートメント

IGAUSS

逆ガウス

CDFPLOT、HISTOGRAM、PPPLOT

KERNEL

核密度推定

HISTOGRAM

LOGNORMAL

対数正規

すべてのプロットステートメント

NORMAL

正規

すべてのプロットステートメント

PARETO

パレート

すべてのプロットステートメント

POWER

べき関数

すべてのプロットステートメント

RAYLEIGH

レイリー

すべてのプロットステートメント

SB

Johnson $S_ B$

HISTOGRAM

SU

Johnson $S_ U$

HISTOGRAM

WEIBULL

Weibull (3 つのパラメータ)

すべてのプロットステートメント

WEIBULL2

Weibull (2 つのパラメータ)

PROBPLOT、QQPLOT


表4.12に、表4.11に示した1次キーワードと共に使用できる2次キーワードを示します。

表4.12: 2次キーワード

2次キーワード

別名

説明

BETAの2次キーワード

ALPHA

SHAPE1

1番目の形状パラメータ$\alpha $

BETA

SHAPE2

2番目の形状パラメータ$\beta $

MEAN

 

当てはめた分布の平均

SIGMA

SCALE

尺度パラメータ$\sigma $

STD

 

当てはめた分布の標準偏差

THETA

THRESHOLD

下限しきい値パラメータ$\theta $

EXPONENTIALの2次キーワード

MEAN

 

当てはめた分布の平均

SIGMA

SCALE

尺度パラメータ$\sigma $

STD

 

当てはめた分布の標準偏差

THETA

THRESHOLD

しきい値パラメータ$\theta $

GAMMAの2次キーワード

ALPHA

SHAPE

形状パラメータ$\alpha $

MEAN

 

当てはめた分布の平均

SIGMA

SCALE

尺度パラメータ$\sigma $

STD

 

当てはめた分布の標準偏差

THETA

THRESHOLD

しきい値パラメータ$\theta $

GUMBELの2次キーワード

MEAN

 

当てはめた分布の平均

MU

 

位置パラメータ$\mu $

SIGMA

SCALE

尺度パラメータ$\sigma $

STD

 

当てはめた分布の標準偏差

IGAUSSの2次キーワード

LAMBDA

 

形状パラメータ$\lambda $

MEAN

 

当てはめた分布の平均

MU

 

平均パラメータ$\mu $

STD

 

当てはめた分布の標準偏差

KERNELの2次キーワード

AMISE

 

カーネル密度の誤差平均平方和(MISE)の機算平均

BANDWIDTH

 

密度推定の区間幅$\lambda $

BWIDTH

 

BANDWIDTHの別名

C

 

密度推定の標準化区間幅

TYPE

 

カーネルの種類:標準、2次、3次

LOGNORMALの2次キーワード

MEAN

 

当てはめた分布の平均

SIGMA

SHAPE

形状パラメータ$\sigma $

STD

 

当てはめた分布の標準偏差

THETA

THRESHOLD

しきい値パラメータ$\theta $

ZETA

SCALE

尺度パラメータ$\zeta $

NORMALの2次キーワード

MU

MEAN

平均パラメータ$\mu $

SIGMA

STD

尺度パラメータ$\sigma $

PARETOの2次キーワード

ALPHA

 

形状パラメータ$\alpha $

MEAN

 

当てはめた分布の平均

SIGMA

SCALE

尺度パラメータ$\sigma $

STD

 

当てはめた分布の標準偏差

THETA

THRESHOLD

しきい値パラメータ$\theta $

POWERの2次キーワード

ALPHA

 

形状パラメータ$\alpha $

MEAN

 

当てはめた分布の平均

SIGMA

SCALE

尺度パラメータ$\sigma $

STD

 

当てはめた分布の標準偏差

THETA

THRESHOLD

しきい値パラメータ$\theta $

RAYLEIGHの2次キーワード

MEAN

 

当てはめた分布の平均

SIGMA

SCALE

尺度パラメータ$\sigma $

STD

 

当てはめた分布の標準偏差

THETA

THRESHOLD

しきい値パラメータ$\theta $

SBおよびSUの2次キーワード

DELTA

SHAPE1

1番目の形状パラメータ$\delta $

GAMMA

SHAPE2

2番目の形状パラメータ$\gamma $

MEAN

 

当てはめた分布の平均

SIGMA

SCALE

尺度パラメータ$\sigma $

STD

 

当てはめた分布の標準偏差

THETA

THRESHOLD

下限しきい値パラメータ$\theta $

WEIBULLの2次キーワード

C

SHAPE

形状パラメータc

MEAN

 

当てはめた分布の平均

SIGMA

SCALE

尺度パラメータ$\sigma $

STD

 

当てはめた分布の標準偏差

THETA

THRESHOLD

しきい値パラメータ$\theta $

WEIBULL2の2次キーワード

C

SHAPE

形状パラメータc

MEAN

 

当てはめた分布の平均

SIGMA

SCALE

尺度パラメータ$\sigma $

STD

 

当てはめた分布の標準偏差

THETA

THRESHOLD

既知の下限しきい値$\theta _0$

すべてのパラメトリック法(KERNEL以外)の分布で使用できるキーワード

AD

 

Anderson-Darling EDF検定統計量

ADPVAL

 

Anderson-Darling EDF検定のp

CVM

 

Cramér-von Mises EDF検定統計量

CVMPVAL

 

Cramér–von Mises EDF検定のp

KSD

 

Kolmogorov-Smirnov EDF検定統計量

KSDPVAL

 

Kolmogorov-Smirnov EDF検定のp


表4.12に示されているインセット統計量を取得するには、プロットステートメントと各統計量を計算するオプションを要求する必要があります。たとえば、次のステートメントを考えます。

proc univariate data=score;
   histogram final / normal;
   inset mean std normal(ad adpval);
run;

MEANおよびSTDキーワードは、それぞれfinalの標本平均および標準偏差を表示します。NORMALキーワードと2次キーワードADおよびADPVALを指定すると、Anderson-Darling適合度検定統計量およびp値がそれぞれ表示されます。HISTOGRAMステートメントでNORMALオプションが要求されるため、NORMALキーワードで指定した統計量のみが使用できます。

KERNELキーワードは、HISTOGRAMステートメントで、核密度推定を要求した場合にのみ利用できます。WEIBULL2キーワードは、PROBPLOTステートメントまたはQQPLOTステートメントで、2パラメータWeibull分布を要求する場合にのみ使用できます。

INSET統計ラベルと出力形式

デフォルトでは、UNIVARIATEプロシジャでは、インセット統計量と該当するラベルが関係付けられ、適切な出力形式を使用して数値が出力されます。ラベルをカスタマイズするには、等号(=)の後にキーワードと目的のラベルを指定し、引用符で囲みます。出力形式をカスタマイズするには、キーワードの後に数値出力形式を指定し、かっこで囲みます。ラベルには、最大24バイト文字まで指定できます。統計量に対してラベルと出力形式の両方を指定する場合は、ラベルの後に出力形式を指定します。たとえば、次のステートメントは、2つの統計のラベルのカスタマイズを要求し、標準偏差をフィールドの幅が5、小数点以下2桁で表示します。

inset n='Sample Size' std='Std Dev' (5.2);

オプションの概要

表4.13はINSETステートメントのoptionsのリストで、INSETステートメントでスラッシュ(/)の後に指定します。詳細は、オプションのリファレンスセクションを参照してください。

表4.13: INSETオプション

オプション

説明

CFILL=color | BLANK

インセットの背景色を指定

CFILLH=color

ヘッダーの背景色を指定

CFRAME=color

枠の色を指定

CHEADER=color

ヘッダーテキストの色を指定

CSHADOW=color

影付き色を指定

CTEXT=color

インセットのテキスト色を指定

DATA

POSITION=$(x,y)$座標のデータ単位を指定

FONT=font

テキストフォントを指定

FORMAT=format

インセット内の値の出力形式を指定

GUTTER=value

上下の余白のインセットのとじしろ幅を指定

HEADER='string'

ヘッダーテキストを指定

HEIGHT=value

インセットのテキストの高さを指定

NCOLS=

上下の余白のインセットの列数を指定

NOFRAME

インセットの周囲の枠を抑制

POSITION=position

インセットの位置を指定

REFPOINT=BR | BL | TR | TL

POSITION=$(x,y)$座標で配置したインセットの参照ポイントを指定


オプションのリファレンス

INSETステートメントのオプションの詳細は次のとおりです。†マークが付けられたオプションは、従来的なグラフを作成する場合にのみ適用できます。

† CFILL=color | BLANK

従来的なグラフの背景色を指定します。CFILLH=オプションを省略すると、ヘッダーの背景が含まれます。デフォルトでは、背景は空白です。このため、インセットに重なっているアイテム(曲線やヒストグラムのバーなど)がインセットを透過して表示されます。

CFILL=オプションの値を指定すると、重なっているアイテムがインセットを透過して表示されなくなります。背景色のないまま、アイテムがインセットを透過して表示されないようにするには、CFILL=BLANKを使用します。

† CFILLH=color

従来的なグラフのヘッダーの背景色を指定します。デフォルト値はCFILL=の色です。

† CFRAME=color

従来的なグラフの枠の色を指定します。デフォルト値はプロットの軸と同じ色です。

† CHEADER=color

従来的なグラフのヘッダーテキストの色を指定します。デフォルト値はCTEXT=の色です。

† CSHADOW=color

従来的なグラフの影付き色を指定します。デフォルトでは、CSHADOW=オプションが指定されていない場合、影付きは表示されません。

† CTEXT=color

従来的なグラフのテキスト色を指定します。デフォルト値はプロットの他のテキストと同じ色です。

DATA

POSITION=オプションでインセットを配置するときに使用するデータ座標を指定します。DATAオプションは、POSITION=(x,y)を指定する場合のみ使用できます。座標(x,y)の直後にDATAを指定します。 :座標によるインセットの配置は、ODS Graphics出力ではサポートされていません。

† FONT=font

従来的なグラフのテキストフォントを指定します。デフォルトでは、インセットをプロット内に配置する場合、フォントはSIMPLEXです。インセットをプロット外に配置する場合、プロットの他のテキストと同じフォントです。

FORMAT=format

インセット内のすべての値の出力形式を指定します。特定の統計量に出形式を指定した場合、その出形式がFORMAT=オプションで指定した出形式より優先されます。SAS出力形式の詳細は、SAS Formats and Informats: Referenceを参照してください。

GUTTER=value

上下の余白にあるインセットのとじしろ幅を画面のパーセント単位で指定します。とじしろは、インセットの(ラベル、値の)ペアの列の間隔です。デフォルト値は4です。 : GUTTER=オプションは、ODS Graphicsが有効な場合にのみ適用されます。

HEADER=string

ヘッダーテキストを指定します。stringは40文字以下で指定する必要があります。デフォルトでは、インセットにヘッダー行は表示されません。INSETステートメントでリストしたすべてのキーワードが、ヒストグラムの当てはめた曲線に対応する2次キーワードである場合、UNIVARIATEプロシジャは、分布を表し曲線を識別するデフォルトのヘッダーを表示します。

† HEIGHT=value

従来的なグラフのテキストの高さを指定します。

NCOLS=n

上下の余白にあるインセットに表示される(ラベル、値の)ペアの列数を指定します。デフォルト値は3です。 : NCOLS=オプションは、ODS Graphicsが有効な場合にのみ適用されます。

NOFRAME

テキストの周囲に描画される枠を抑制します。

POSITION=position
POS=position

インセットの位置を指定します。位置は、方位点キーワード、余白キーワードまたは座標ペア(x,y)です。座標は、軸のパーセント単位またはデータ単位で指定できます。デフォルト値はNWです。この場合、インセットは画面の左上端(北西)に配置されます。詳細は、インセットの配置セクションを参照してください。

:座標によるインセットの配置は、ODS Graphics出力ではサポートされていません。

† REFPOINT=BR | BL | TR | TL

UNIVARIATEプロシジャがPOSITION=オプションの座標ペアによって配置する、インセットの参照ポイントを指定します。 REFPOINT=オプションは、座標(x,y)に配置するインセットの枠の端を指定します。キーワードは、BL、BR、TL、TRです。それぞれ、左下端、右下端、左上端、右上端に対応します。デフォルト値はBLです。 REFPOINT=は、POSITION=(x,y)の座標とともに使用する必要があります。このオプションは、ODS Graphics出力には適用されません。