SASによる欠測データの多重補完(1日間)
75,600円(本体価格 70,000円)/※チケットのお取り扱いはありません
【注意】 本コースは、英文書籍を使用し日本語で説明を行います。
受講対象
SASによる統計解析に従事する方
特に欠測のあるデータを扱う生物統計・医療統計の担当者、疫学・公衆衛生学の研究者、社会科学系の研究者、自然科学系の研究者、企業の統計解析担当者・データアナリスト
前提知識
学習内容
欠測データに対して多重補完(Multiple Imputation)という手法でデータを補うためのプロシジャ「PROC MI」について学びます。
欠測データがどのようにして生まれるか?その発生メカニズムや発生パターンから欠測データを無視したり単一の値を補うことでどのような問題が生じるのかなど、
基本的な内容からMIプロシジャの使い方までを学習します。
コンテンツ
- ■欠測データ入門:欠測のあるデータを解析する手法
- ・欠測の原因と欠測パターン
- ・データの欠測メカニズム
- ・欠測データへの対処方法
- ■多重補完法の理論と手法
- ・多重補完法の特徴
- ・補完モデルの定義
- ・多重補完法のアルゴリズム
- ・多重補完されたデータの解析
- ・多重補完されたデータによる推定と推測
- ・MIプロシジャによる推定
- ・MIによる補完は何回実施する必要があるか
- ■多重補完のための準備
- ・多重補完に含める変数の選択
- ・欠測データの量とパターン
- ・補完される変数の種類
- ・補完方法
- ・補完回数
- ・MIプロシジャとは
- ■雑な標本調査データを解析するための多重補完
- ・複雑な標本調査とは
- ・MIプロシジャへの組み込み
- ・MIプロシジャによる推測
- ・部分集団における解析
- ■連続変数に対する多重補完
- ・恣意的な欠測パターンを持つデータの補完
- ・回帰と予測平均マッチング法による複数の単調な欠測を持つ変数の補完
- ・FCS法による恣意的で複数の欠測を持つ変数の補完
- ■分類変数に対する多重補完
- ・Logistic法による単調な欠測パターンを持つ変数の補完
- ・FCS判別関数およびFCSLogistic回帰による恣意的な欠測パターンを持つ複数の変数の補完(自己学習)
- ・恣意的な欠測パターンを持つ複数の変数の補完におけるFCSとMCMC/Monotone法の比較(自己学習)
- ■多重補完のケーススタディ(自己学習)
- ・HRS2006のデータを用いて欠測のないデータのみでの解析と多重補完による解析の比較
- ・てんかん発作の追跡研究を用いた多重補完による解析
- ■PROC MIANALYSISのためのデータセットの準備(自己学習)
- ・メジャーリーグの選手の給料のデータを多重補完する
- ・NSC-Rデータを多重補完する
- ・PROC SURVEYPHREGのアウトプットをPROC MIANALYSISに用いる
※ 内容は予告なく変更する場合があります。
テキスト
担当講師
慶應義塾大学医学部衛生学公衆衛生学 助教 竹内 文乃 氏