ROOM B
8月7日(金)
14:30 - 15:00
【B-09】【プ】チュートリアル

一世を風靡したRandom Forest (Random Woods)がSAS(IMSTAT)で使えるようになったので縦長/横長データに適用してみる


塩野義製薬株式会社
解析センター

木口 亮

共同発表者:北西 由武
都地 昭夫
渡辺 秀章

近年,医薬品業界の開発領域で扱うデータも多様化している.例えば,レセプトデータに代表されるReal World Dataは縦長データ,つまり,超多サンプル少変数のデータ構造をとることが多い.一方,従来から扱っている臨床試験データは少サンプル多変数,さらには遺伝子データに至っては,少サンプル超多変数のデータ構造をとることが多い.いずれのデータ構造に依らず,関心のあるアウトカムに対する予測モデルに適切な解釈を与えるために,説明変数を予め選択してモデル構築をすることは重要である.本発表では,縦長/横長の仮想データに対し,ロバストな変数選択の手法の一つとして,SAS(IMSTAT)に搭載されているRandom Forestを適用し,その性能を考察する.また,GLMSELECTプロシジャを用いて,その他の変数選択の手法との比較も行う.

【発表形式】プレゼンテーション

【チェアマン】