UNIVARIATEプロシジャ

例4.19 ヒストグラムへの正規曲線の追加

この例は例4.14の続きです。次のステートメントはTransデータセットの厚さの測定値に正規分布を当てはめ、当てはめた密度曲線をヒストグラムに重ねて表示します。

title 'Analysis of Plating Thickness';
ods select Histogram ParameterEstimates GoodnessOfFit FitQuantiles Bins;
proc univariate data=Trans;
   histogram Thick / normal(percents=20 40 60 80 midpercents)
                     odstitle = title;
   inset n normal(ksdpval) / pos = ne format = 6.3;
run;

ODS SELECTステートメントは出力を"ParameterEstimates"、"GoodnessOfFit"、"FitQuantiles"、"Bins"の各テーブルに制限します。ODSテーブル名のセクションを参照してください。NORMALオプションは、出力4.19.2に示したヒストグラムに正規曲線が表示されるよう指定します。また、出力4.19.1に示した当てはめた分布の要約 (適合度検定、パラメータ推定値および当てはめた分布の分位点)を要求します (PROC UNIVARIATEステートメントでNORMALTESTオプションを指定した場合は、正規性のShapiro-Wilk検定が統計量テーブルに含まれます)。

2次オプションはNORMAL 1次オプションの後にかっこで囲んで指定されます。PERCENTS=オプションは分位点を指定します。これらの分位点は"FitQuantiles"テーブルに表示されます。MIDPERCENTSオプションは、(当てはめた正規分布から推定された)各間隔の中間点、オブザベーションの観測されたパーセンテージおよび母集団の推定されたパーセンテージの一覧を示すテーブルを要求します。NORMAL 1次オプションの後に指定できる2次オプションについては、表4.6を参照してください。

出力4.19.1: 当てはめた正規分布の要約

Analysis of Plating Thickness

The UNIVARIATE Procedure
Fitted Normal Distribution for Thick (Plating Thickness (mils))

Parameters for Normal Distribution
Parameter Symbol Estimate
MEAN Mu 3.49533
Std Dev Sigma 0.032117

Goodness-of-Fit Tests for Normal Distribution
Test Statistic p Value
Kolmogorov-Smirnov D 0.05563823 Pr > D >0.150
Cramer-von Mises W-Sq 0.04307548 Pr > W-Sq >0.250
Anderson-Darling A-Sq 0.27840748 Pr > A-Sq >0.250

Histogram Bin Percents
for Normal Distribution
Bin
Midpoint
Percent
Observed Estimated
3.43 3.000 3.296
3.45 9.000 9.319
3.47 23.000 18.091
3.49 19.000 24.124
3.51 24.000 22.099
3.53 15.000 13.907
3.55 3.000 6.011
3.57 4.000 1.784

Quantiles for Normal Distribution
Percent Quantile
Observed Estimated
20.0 3.46700 3.46830
40.0 3.48350 3.48719
60.0 3.50450 3.50347
80.0 3.52250 3.52236



出力4.19.2: 正規曲線を重ねて表示したヒストグラム

正規曲線を重ねて表示したヒストグラム


正規曲線を重ねて表示した変数Thickのヒストグラムが出力4.19.2に示されています。

正規曲線の推定されたパラメータ($\hat{mu}=3.50$および$\hat{\sigma }=0.03$)を出力4.19.1に示します。デフォルトでは、NORMAL 1次オプションの後にMU=およびSIGMA= 2次オプションで値を指定しなかった場合、パラメータが推定されます。経験分布関数(EDF)に基づく3つの適合度検定の結果が出力4.19.1に示されています。p値がすべて0.15より大きいため、正規性の仮説は棄却されます。

この例のサンプルプログラムuniex08.sasは、Base SASソフトウェアのSASサンプルライブラリに含まれています。