Data Scientists Special Talk Session
データサイエンティストが語るアナリティクスの現在と未来

【 前編:アナリティクスの現在を語る 】(3/4)

データサイエンティストの由来と現在

―― 企業によってレベルはあれ、アナリティクスとビジネスの結びつきが強まってきた時代の流れの中で、「データサイエンティスト」という言葉が脚光を集めるようになってきました。孝忠さんには本日、NECのデータサイエンティストとして鼎談にお出でいただいています。

孝忠 はい。実は私を含めたこの3名は、全員「データサイエンティスト協会」という組織に属しているんです。

―― データサイエンティスト協会をご存知ない読者のために、簡単にご紹介をお願いできますでしょうか。

孝忠 データサイエンティストという言葉自体は、ブーム以前の昔からあったものなんです。「データサイエンス」や「データエンジニア」という言葉からの流れですね。ですが昨今の流れを受けて、言葉をしっかり定義しなければということで、協会が作られた。そこに私たちが所属しているという状態です。データサイエンティストという言葉も、ビッグデータの黎明期と同じく、非常に曖昧な定義で使われ始めたんですよね。語る人によって、まったく定義が違うという…

―― その前にあった「データサイエンス」という言葉の定義は、明確なものだったんでしょうか?

孝忠 それも、かなり曖昧な部分が多いです。もともとこの業界は、しっかりと定義された言葉が意外に少ないと個人的には思っています。20年程前のデータウェアハウスから始まった情報活用ブームでいうと、データマイニングの時点でかなり曖昧になり、BIではもっと曖昧になって、データアナリティクスではさらに…という感じです。

―― 孝忠さんのおっしゃっている「曖昧になっている」というのは、言葉の境がはっきりしない、茫洋と範囲が広くなっているという意味合いでしょうか?

孝忠 そうですね。境界が定義されない、あるいは「多面性を持っている」という言い方が正しいかもしれませんが、人によって見方がまったく違う。立方体が見方によって変わるように、SIerの見方、コンサルティングの見方、ベンダーの見方が異なっている。しかし実体としては、同じものを指しているというイメージです。

データサイエンティストは、昔から存在した?

―― コンサルタントの立場から、辻さんはどう思われますか?

 難しいお題ですね…。個人的な意見ですが、データサイエンティストという言葉は、ある日突然「セクシーな職業」みたいな感じでやってきたものなんですね。ですがそれ以前も以降も、仕事は変わっていないんです。
 では、そのセクシーと呼ばれている職業の像を見てみると、確かに分析の技術や技法に関しては、最新の学会で発表されたものを取り入れていたり、学会発表レベルであったりーWeb系のサーチエンジンやコンピュータービジョン、画像認識といったものですねーそういう部分の精度を上げるために、いかなるロジックやアルゴリズムを行えばいいのかを研究している姿。まさにサイエンティストのイメージです。
 もう1つ言われるのが、よりデータ側の人たち。どういう出所から、どんなデータを取ってきて、どう貯めてどう活用するのか。それがデータサイエンティストの1つの役割になっている。また、その分析結果をビジネスに活かすための社内調整プレゼントが上手い人も、データサイエンティストと言われます。
 ですから、ビッグデータと関連していて、それらを有効に扱わなくてはいけない、有効に扱いたいというモチベーションが、データサイエンティストという言葉を生み出したのかなと。

―― 孝忠さん、辻さん、ありがとうございます。山下さんはいかがでしょうか。

山下 私は仕事としては、完全に以前からあるものだという意識を持っています。データ活用が進んできて、活用次第で勝つか負けるかという状態にまで進んできて、その時に役割が設定されたんだろうなと。私はコンサルティング出身なんですが、とはいえお客様の業務はもちろん、インフラも踏まえて、細かい分析までもやっているんですね。それを1つのコンポーネントのように捉える言葉というのは、コンサルティングの流れから見ると非常に自然だなと思っていました。

一番嬉しいのは、
お客様とゴールを決めたその時に、
ほぼ当初の設定通りに行けた
場合ですね。

データサイエンティストの「布陣」と「能力」

―― 孝忠さんにお伺いしたいんですが、NECの中でデータサイエンティスト的なお仕事を実践されている方は、どのくらいいらっしゃるんでしょうか?

孝忠 広義に捉えると、NEC内に600名体制のデータ分析要員がいます。

―― 山下さん、SASとしてはどういった感じでしょうか?

山下 SASとしては30~40人くらいでしょうか。データサイエンティストの目的としては、お客様のバリューを出すとか、売上を上げる、コストを下げるといったことになります。それを実現するために、実はいろんなメンバーが参加するんですね。トップでは、孝忠さんのような感覚を持った人がコントロールしていくんですよ。その下に、データサイエンスやインフラ、ビジネスがわかる人が付く…という感じになっています。ですから、一概に誰がデータサイエンティストだと言うことは、なかなか難しいところもあります。

 だいたいはチーム制でやっているんですよね。3人くらいが合体して孝忠さんになっているんです。パーツは何かというと、1つ目はデータマネジメント。どこからどうデータを持ってくるかを決めたり、欠落しているデータの扱いを決めたりしながら、データの収集や整形処理を行う人材ですね。いわゆる28(ニハチ)の法則と言われる、分析前の8割の工程がここに当たります。後の分析の工程をデザインしながら行うのがポイントになります。

 2つ目が分析です。課題に対して、適切な分析手法を1つないし複数組み合わせて結果を出す。その結果が、1つはモデルというかたちの生成物になってコンピューターで実行され、スコアリングされて市場に向かう。あるいはレポートというかたちになる。過去の現象は実はこういう構造になっていて、こういう分析で原因が特定できたので、こう改善していきましょう、といった提案ですね。
 3つ目には、これらに関しては別組織や複数の人々が動くので、納得性を持ったプレゼンテーションができる、組織の調整能力がある人が必要になります。この3パートが上手く機能していると、1人の孝忠さん、すなわちデータサイエンティストになる。
 整理すると、「データマネジメント」「分析」「実行・実践(プレゼン・組織の調整能力)」といった感じでしょうか。

―― 孝忠さん、いかがでしょう。

孝忠 そうですね。本当に1人でできているかという話はありますが、お二人とほぼ同じ認識です。ただ、一番大事になるのは、データや分析に基づいて、ビジネスにどれだけ貢献できるか、アウトプットを出せるか。そこが勝負かなと思います。

固まりつつあるデータサイエンティストのスキル定義

―― データサイエンティスト協会のお話が出ましたが、そこでは、データサイエンティストのスキル定義は明確なんでしょうか。

孝忠 はい。データサイエンス力、データエンジニアリング力、ビジネス力の3つの観点で定義されます。データサイエンス力が、いわゆる分析ですね。データエンジニアリング力は、データを泥臭く集めたり、綺麗にしたり、システムに組み込む作業。最後が、いわゆるビジネススキルといわれるものです。分析をどう価値に変えるか、バリューを出すか。

―― データサイエンティストは一般論として、統計解析をみっちり勉強して理論に詳しくなければ…というイメージが強いのではないかと思うんですが、その辺りは実際、どうなんでしょうか?

孝忠 データサイエンティスト協会では、個々人のレベルによって、段階が設定されています。いわゆる見習い的な段階から、大工で言うところの棟梁のようなポジションがあり、最終的にはスーパーマンみたいな人がいて。ですが、データサイエンス力、エンジニアリング力、ビジネス力、すべてがスーパーマンという人は、おそらく存在しないと思います。

山下 全領域のスーパーマンは無理なので、自分は各領域の中でどこが強みなのかということを踏まえた上で、その3つの観点を併せ持つ。3つ兼ね備えないと進められない時代になってきたというのが、新たな定義なんだと思います。