Data Scientists Special Talk Session
データサイエンティストが語るアナリティクスの現在と未来

【 前編:アナリティクスの現在を語る 】(1/4)

多種多様なデータが爆発的に増加する現在。そこから知見を見出すアナリティクスの重要性が増しています。そこで注目を集める存在が「データサイエンティスト」。当記事では、気鋭のデータサイエンティスト 孝忠大輔氏をNECビッグデータ戦略本部からお招きし、SASのコンサルタントと3名による特別鼎談を行いました。最先端の現場から見える、アナリティクスの現在、そして未来。2号連続でお届けします。
※本記事は2016年1月発行のSAS Technical News 2016 Winterに記載されたものです。

kochu-daisuke2

孝忠 大輔氏

日本電気株式会社
ビッグデータ戦略本部 主任
データサイエンティスト

tsuji-hitoshi

辻 仁史

SAS Institute Japan株式会社
ソリューションコンサルティング本部
Information Management グループ
アナリティクスリード シニアマネージャー

yamashita-katsunori2

山下 克之

SAS Institute Japan株式会社
ソリューションコンサルティング本部
エンタープライズアナリティクス
推進グループ 部長

―― 孝忠様、本日はお忙しい中、誠にありがとうございます。この鼎談は、企業や組織のデータ活用の鍵を握るといわれる「データサイエンティスト」について、データサイエンティストその人から語っていただくという趣旨で企画されたものです。日々、どのような課題に取り組み、どんなデータを、いかに分析しているのか。そこから見えてくる未来像は?そんなテーマで議論を深めていければと思っています。最初に自己紹介を、まず孝忠様からお願いできますでしょうか。

孝忠 NECビッグデータ戦略本部の、孝忠と申します。SAS Technical Newsではここ4号にわたって、技術的な連載を持たせていただきました。今日の鼎談では、データサイエンティストとしての日々の思考、実践、エピソードといった、より現場的なお話なども、皆さまとできればと思っています。

 SASソリューションコンサルティング本部、アナリティクスリード担当の辻と申します。私はお客様のデータに基づいて分析を行うコンサルティングを長く行ってきましたので、今でいうデータサイエンティストに近い仕事をしてきたということで、今回、鼎談に参加させていただいております。私の部署では、お客様に対するプリセールス活動も行っております。

山下 同じくソリューションコンサルティング本部の、エンタープライズアナリティクス推進の山下です。私の部署は、お客様にアナリティクスのサービスを提供する、SASの中でもややハイエンドなテーマに特化しているチームです。本日はどうぞよろしくお願いします。

データサイエンティストの「ビッグデータ」観

―― このように「データサイエンティスト鼎談」といった趣のメンバーなのですが、そもそもなぜ、こういった職種が登場してきたのか?その背後には、活用すべきデータが膨大化したことが挙げられると思います。孝忠さんの所属されている「ビッグデータ戦略本部」という部署名が象徴的ですね。そこでまず、皆さまが日々取り組まれている「ビッグデータ」とは何か。その定義や実際といった辺りから、お話を切り出せればと思います。

データや分析に基づいて
ビジネスに
どれだけ貢献できるか、
アウトプットできるかが
勝負だと思います。

孝忠 ビッグデータのブームが始まったのが3~4年前ですが、当時から、定義は非常に曖昧でした。ハードウェアベンダーやコンサルティング会社が、それぞれの立場からそれぞれの流儀で語ってきて、定義に落ちないまま今に至っているのではないかというのが正直な感想です。
 では、我々はビッグデータをどう定義しているかというと、ビッグデータ=大量のデータではありません。これまで取れなかったデータ、眠っていたデータ ―結果的にスモールなものも包括することになるんですが― これらすべてを、ビッグデータと捉える。それをいかに活用していくのかがビッグデータビジネス、という考え方をとっています。

―― 「取れなかったデータ」・・・興味深い観点ですね。山下さんはいかがでしょうか?

山下 SASでは本社による定義がありまして。孝忠さんがおっしゃったように、使っていない、あるいは使いきれていないデータ。さまざまなセンサーやソーシャル周りの情報も、まだシステム側で回しきれていないという実感があります。その会社が使っていなければ、すなわちビッグデータ。データ量の大小ではなく、相対的な呼び方なのかなと。

―― 辻さんのお考えは?

 お二人と重なる部分もありますが、ビッグデータは狭義ではログを指しているのではないでしょうか?従来に比べて、センサーログやアクセスログが飛躍的に大量に生成されることを、ビッグデータという。もう少し広い意味で言うと、テキストや画像、音声といった非構造データ。それらを扱える手法が確立されてきたために、ビッグデータという名前が付いてきたのではないでしょうか。

―― 従来も、各種センサーや、アクセスのトラッキングの仕組みは存在していたかと思います。それがこの数年、ビッグデータという顕著なムーブメントになっていることには、何か注目すべき理由があるんでしょうか?

孝忠 NECにおけるビッグデータ活用の定義は、「センシング」「アナリティクス」「アクチュエーション(制御・誘導)」の3つです。この内のセンシングの技術が発達してきたことが、この2~3年のトレンドなのかな。それからデバイスですね。車にセンサーが載るようになったり、自動販売機にセンサーが入ったり。データがより取りやすくなった点が大きいんじゃないかと思います。

山下 孝忠さんと同じく技術的観点から言えば、ストレージやハードの利用環境が変わって価格も圧倒的に下がり、大量のデータを取っておける状態になった。そこで活用しようという動きが増えたのは間違いないと思います。それからGoogleに始まり、Hadoopなどの動きに見られる非構造化データのあり方ですね。新技術と価格、この2点でしょうか。