ロジスティックモデルにおけるパラメータ値の活用

[OS] ALL
[リリース] 9.1
[キーワード] LOGISTIC, INEST= option, OUTEST= option

[質問]

LOGISTICプロシジャにて、データセットAを用いてモデルの当てはめを行なっています。
この際、算出されたパラメータの推定値を用いて、他のデータセットBに用い、統計量(予測確率と観測データの応答との関連性など)を算出することができますか。

[回答]

LOGISTICプロシジャでは、算出したパラメータ推定値をデータセットに出力するためのオプション、OUTEST=オプションがあります。また、パラメータの初期値を含むデータセットをINEST=オプションにて指定することができます。これらオプションを利用して、以下の手順にて既存のパラメータの値に基づく、統計量の算出を行なうことができます。

  1. データセットAに対してLOGISTICプロシジャを実行します。
    このとき、OUTEST=オプションを追記し、パラメータ推定値を含むデータセット(たとえば、EST)を作成します。

  2. データセットBに対してLOGISTICプロシジャを実行します。
    このとき、INEST=オプションを用い、すでに作成したデータセットESTを指定します。
    またMAXITER=オプションを用いて、推定における反復回数を0に設定します。

例:INEST=オプションとMAXITERオプションの利用例


   PROC LOGISTIC DATA=B INEST=EST;
     MODEL <モデル式の記述> / MAXITER=0;
   RUN;

推定における反復回数を意図的に0と設定しているため、「収束基準を満たしていない」、「モデルの当てはめの妥当性は疑わしい」などの、WARNINGメッセージが表示される場合があります。