ROOM D
8月7日(金)
15:45 - 16:15
【D-10】【論】オープンデータ,経済分析,統計解析

統計センターの匿名データ13万件を用いた統計解析の実践


BioStat研究所株式会社

代表取締役
高橋 行雄

共同発表者:



(独)統計センターの5年ごとの3回分の全国消費実態調査に関する13万件の匿名データを用いて,データの併合,データの再編成を行い,各種の統計解析を試みたので,その概要を報告する.それぞれ1Gバイトのデータの併合では,調査年ごとに全体としては似てはいるが,細部は異なる構造を持つデータの併合の留意点を示す.匿名データは,1サンプル1行の約1800変数のフラットファイルであり,この構造のままの統計解析は困難である.そのためにRDB形式に再編成する際の留意点を示す.統計解析に際しては,適切な変数ラベル,数値化されたカテゴリ変数に対する適切なカテゴリ名の付与が必要であり,これらが統計解析の結果に対する解釈の効率に寄与する.従来は,データボリュームが大きすぎ32bit版のJMPでは取り扱いが困難であったが,64bit版のJMPによって容易になった.消費実態が1994年から2004年にかけてどのような変化があったのかを,133,088件のデータを用いて浮き彫りにする.

【発表形式】論文

【チェアマン】兵庫県立大学 名誉教授 周防 節雄BioStat研究所株式会社 高橋 行雄