CORRプロシジャ

例2.8 散布図の作成

次のステートメントは、データセットFish1(例2.6で作成されたもの)内にある変数を使用して相関分析を実施し、散布図を作成します。

ods graphics on;
title 'Fish Measurement Data';
proc corr data=fish1 nomiss plots=matrix(histogram);
   var Height Width Length3 Weight3;
run;
ods graphics off;

出力2.8.1の表"Simple Statistics"には、分析変数の単変量統計量が示されています。

出力2.8.1: Simple Statistics

Fish Measurement Data

The CORR Procedure

4 Variables: Height Width Length3 Weight3

Simple Statistics
Variable N MEAN Std Dev SUM Minimum Maximum
Height 34 15.22057 1.98159 517.49950 11.52000 18.95700
Width 34 5.43805 0.72967 184.89370 4.02000 6.74970
Length3 34 38.38529 4.21628 1305 30.00000 46.50000
Weight3 34 8.44751 0.97574 287.21524 6.23168 10.00000



出力 2.8.2の表"Pearson Correlation Coefficients"には、分析変数ペアのPearsonの相関統計量が示されています。

出力2.8.2 Pearson Correlation Coefficients

Pearson Correlation Coefficients, N = 34
Prob > |r| under H0: Rho=0
  Height Width Length3 Weight3
Height
1.00000
 
0.92632
<.0001
0.95492
<.0001
0.96261
<.0001
Width
0.92632
<.0001
1.00000
 
0.92171
<.0001
0.92789
<.0001
Length3
0.95492
<.0001
0.92171
<.0001
1.00000
 
0.96523
<.0001
Weight3
0.96261
<.0001
0.92789
<.0001
0.96523
<.0001
1.00000
 



これらの変数の間には高い相関があります。たとえば、変数HeightWidthの間の相関は0.92632です。

PLOTS=MATRIX(HISTOGRAM)オプションを指定すると、出力2.8.3に示すようなVAR変数を使用した散布図行列が作成されます。

出力2.8.3: 散布図行列

Scatter Plot Matrix


このグラフ表示を要求するには、ODS Graphicsを有効にし、PLOTS=オプションを指定します。ODS Graphicsの詳細は、SAS/STAT 13.2 User's GuideChapter 21: Statistical Graphics Using ODSを参照してください。

HeightWidth間の相関を調べる場合、次のステートメントにより、出力2.8.4に示すような、2変数の予測楕円付きの散布図を作成します。

ods graphics on;
proc corr data=fish1 nomiss
          plots=scatter(nvar=2 alpha=.20 .30);
   var Height Width Length3 Weight3;
run;
ods graphics off;

PLOTS=SCATTER(NVAR=2)オプションを指定すると、VARリスト内の最初の2つの変数を使った散布図が作成されます。ALPHA=.20 .30サブオプションは、それぞれ$80\% $および$70\% $の予測楕円を要求します。

出力2.8.4: 予測楕円付きの散布図

予測楕円付きの散布図


予測楕円とは、2変量正規性を仮定して母集団内の新しいオブザベーションを予測するための領域です。またこれは、母集団の指定した割合を含む領域に近似します。表示される予測楕円は、平均$(\bar{x},\bar{y})$を中心としています。詳細は、信頼楕円と予測楕円のセクションを参照してください。

次のステートメントも、出力2.8.5に示すような、変数HeightWidthを使った散布図を作成します。

ods graphics on;
proc corr data=fish1
          plots=scatter(alpha=.20 .30);
   var Height Width;
run;
ods graphics off;

出力2.8.5: 予測楕円付きの散布図

予測楕円付きの散布図


出力2.8.5には点$(13.9,5.1)$が含まれています。この点は、出力2.8.4からは除外されていました。これは、オブザベーションがWeight3で欠損値を含んでいたためです。出力2.8.5の予測楕円には、このオブザベーションの包含も反映されています。

次のステートメントは、出力2.8.6に示すような、平均の信頼楕円を作成します。

ods graphics on;
title 'Fish Measurement Data';
proc corr data=fish1 nomiss
          plots=scatter(ellipse=confidence nvar=2 alpha=.05 .01);
   var Height Width Length3 Weight3;
run;
ods graphics off;

PLOTS=オプションに続いてNVAR=2サブオプションを指定すると、VARステートメント内の最初の2つの変数に対して作成される散布図の数を制限できます。ELLIPSE=CONFIDENCEサブオプションは、平均の信頼楕円を要求します。ALPHA=.05 .01サブオプションは、それぞれ$95\% $および$99\% $の信頼楕円を要求します。

出力2.8.6: 信頼楕円付きの散布図

信頼楕円付きの散布図


この信頼楕円は、平均$(\bar{x},\bar{y})$を中心としています。詳細は、信頼楕円と予測楕円のセクションを参照してください。