あなたの趣味を究めてください

いま、データサイエンティストが活躍する現場~
株式会社テプコシステムズ

システム企画室
デジタライゼーション推進部
デジタライゼーション推進グループ
マネージャー
大友 翔一氏

私のキャリアは、JAXAのデータセンター勤務からスタートしました。その後、慶應大学の客員研究員になり、現在も兼務しています。そして、ソニーを経て現職に就きました。静岡大学の客員准教授も拝命しています。キャリアを通じて、計算機科学やデータ解析関連の職を歴任してきたことになります。記事も書いていて、「食べログデータからおいしいラーメン屋を探せるか」、「ホッピーが売れそうな店はどこか」など一般の方でも興味を持って頂けそうなものもありますので、ぜひ読んでみてください。

現在、私はTEPCOグループでデータサイエンティストとして働いていますが、個人的には、「データサイエンティスト」と呼ばれるようになれば、どのような組織・現場でも活躍できると思っています。そこで、今日は私がどのように「データサイエンティスト」と呼ばれるようになったかについて、主に趣味の話をしながらお伝えしたいと思います。

私の趣味の1つは釣りで、データ分析が釣りに役立った例をお話しします。使ったのは、水循環変動観測衛星「しずく」の海水温データをはじめ、海上風速データや、海上保安庁が公開している海流データです。省庁や団体をまたいでデータを一括管理するサービスを作りました。これらはHDF5やGISという特有のデータ形式になっていて、一般の方が扱うにはハードル高いです。そこで、可能な限り標準化して、緯度と経度と日付だけを投げれば物理量を取れる仕組みを、数名の友人と作成しました。使い方は簡単です。HTTPのGETリクエストを送れば、使用言語を問わずに情報を取得できます。

このサービスを作ったのは、釣果予測をしたかったためです。釣果の実績データは、ある程度そろいます。たとえば、管理公園ではどんな魚がどれくらい釣れたのかが公開されています。最近では、Twitterに投稿してくれる人も居ますし、釣具屋さんが情報をアップしてくれるケースもあります。これらのデータを取り込み、さらに海水温や風、海流の情報を加えて未来を予測しようとしたのです。

アジやサバは、9月の後半に急に釣果が上がります。昨日まで20尾しか釣れなかったのに、ある日突然1000尾釣れるようになります。これは、「釣り人のカン」としてだれもが知っていることなのですが、この急上昇が「具体的にいつ起こるか」まではわかりません。釣れるのは、その後数週間で、徐々に釣果は下がってきます。その時期をピンポイントで当てようとしたわけです。

結果は、大漁です。たとえば、宮城にヒラメ釣りに行ったときには、8枚釣ることができました。1枚釣れたら良い方で、ゼロか1かと言われている中の8枚です。まだ開発中ですが、結果を出せたのはうれしいですね。

さて、ここで使った気象データですが、仕事にも役立っています。気象データは、電力の需給を決定する重要なファクターになるためです。寒ければヒーター、暑ければエアコンを使いますから、電力需要が上がります。太陽光発電の発電量の予測もできます。また、「太陽光でまかなえるぶん、コストのかかる火力を下げる」など電力のバランシングに使えます。しずくは水を観測する衛星なので、川に流れ込む水の量を予測するためのデータとして利用することも出来ます。その水がダムに貯まり、放水するときに発電機を回せば、純国産のクリーンなエネルギーを得られます。

こうして、趣味は仕事にも応用できるのです。私が学生の方に伝えたいことは、「あなたのやりたいことを決めてください」ということです。技術的な手法を勉強することや優秀なモデルを作ることより、それをどのような目的に使うかのほうが重要です。あなたの趣味を究めてください。技術はおのずとついてきますから。