アナリティクス

概要と重要性

アナリティクスとは何か?

アナリティクスは包括的かつ多面的な分野であり、記録されたデータに潜む有意義なパターンや知識を発見するために、数学、統計学、予測モデリング、機械学習などの手法を活用します。

今日では、増え続ける大量のデータを保管するためのIT環境や、高度なソフトウェア・アルゴリズムを実行するためのIT環境に強力なコンピューターを追加することで、事実にもとづく意思決定に欠かせない洞察を極めて短時間で導き出せるようになっています。数値、データ、分析的発見に関する科学を業務の現場に組み込むことで、さまざまな想定や確信が本当に正しいかどうかを明かにすることができます。また、これまで考えもしなかった疑問に答えを出すことも可能になります。これこそがアナリティクスのパワーです。

アナリティクスが重要な理由

1749年にスウェーデン政府が実施した世界最初(と言われている)人口データ収集プロジェクトから、1850年代にフローレンス・ナイチンゲール(Florence Nightingale)氏が行った死亡率データの記録と分析、1950年代に英国の研究者リチャード・ドール(Richard Doll)氏が行ったタバコと肺がんの関連性の研究まで、データ分析は何百年もの間、知識発見の原動力となってきました。

これら3つのシナリオでは、それまでは解決できないと考えられていた疑問に答えを出すことが目標となりました。1700年代のスウェーデンでは、適切な軍事力を維持する最良の方法を突き止めるために、人口の地理的な分布状況を把握したいと考えました。ナイチンゲール氏が知りたかったのは、衛生と看護が死亡率の低下に果たす役割でした。ドール氏が知りたかったのは、喫煙者の方が肺がんにかかる確率が高いのかどうかということでした。

こうしたパイオニアたちは皆、直感だけでは不十分なことを知っていました。データを分析すれば、相関関係やパターンを明らかにすることができ、推測や直感に頼る必要性は減ります。データ分析が役立つのは、次のようなタイプの疑問です。

  • 何が起きたのか?
  • その原因や理由は何だったのか?
  • 今は何が起こっているのか?
  • 次に起こる可能性があるのは何か?

より高速かつ強力なコンピューターが利用できるようになった現在では、アナリティクスとビッグデータを活用するチャンスが無限に広がっています。信用リスクの判断、新薬の開発、製品やサービスの提供を効率化する方法の発見、不正の防止、サイバー・セキュリティ上の脅威の特定、最も価値が高い顧客の維持など、どのような用途であっても、アナリティクスは企業や組織、ひいては周囲の世界について理解を深めるために役立ちます。

 

事実にもとづく意思決定は、当社の競争上の強みとなっています。アナリティクスを活用するか否かに、もはや選択の余地はありません。

ダン・イングル(Dan Ingle)氏
Kelley Blue Book社、分析テクノロジー担当副社長
ユーザー事例を読む(英語)

広く使われているアナリティクス手法

今日利用されているアナリティクスは3つのタイプに大別されます。

  • 記述統計:最も古くから利用されてきたのが記述統計です。スウェーデンが世界初の人口統計を作成したのは1749年でした。人口を表形式で数えることは、収集したデータポイントの要約という意味で、記述統計の第一歩といえる取り組みでした。これらは、どのような事象がなぜ発生したのかを理解するために役立つモデルです。今日でも記述統計は、Webページのクリック数から、生産数と販売数の比較まで、実に幅広い目的に利用されています。
  • 予測分析(予測的アナリティクス):予測分析(予測的アナリティクス)は近年、急速に普及してきました。主な推進要因となってきたのは、顧客の行動を予測したいという企業の要望です。コンピューティング・パワーの向上によって数百、数千のモデルを高速に実行できるようになり、また、サポート・ベクター・マシン、ニューラル・ネットワーク、ランダムフォレストなどの予測手法を利用できるソリューションが普及してきたことを受け、多くの企業が現場の業務プロセスに予測分析を組み込むようになっています。こうした予測モデルでは、過去のデータに予測アルゴリズムを適用し、次に起こると考えられる事象の発生確率を判断することができます。
  • 指示的アナリティクス:指示的アナリティクスは3種類の中で最も新しい領域です。これから何が起こるかを知ることと、何をすべきかを知ることは、全く別の話です。指示的アナリティクスは、「将来のシナリオの予測結果にもとづき、最適な意思決定に関する推奨事項を提示する」という方法で、何をすべきかという疑問の解決を支援します。指示的アナリティクスを成功に導くカギは、リアルタイムで答えを導き出すのに必要十分なビッグデータ、コンテクスト・データ、高度なコンピューティング性能を活用できる環境を整えることです。

アナリティクスから最大限の価値を引き出す方法

アナリティクスという言葉は広く耳にするようになっていますが、企業や組織にとって適切なアナリティクスの種類を判断するには、どうすればよいのでしょう? 旅行の場合と同様、アナリティクスでも、まずは最終目的を決めることが大事です。どれほど初歩的な目的でもかまいません。最初に決める必要があるのは「どこへ行き、何を見たいか?」ということです。その上で、そこへ行き着くために何が必要かについて情報を収集します。

今日のアナリティクス・ジャーニーの場合、大量のデータが存在し、十分な性能のコンピューターが妥当なコストで利用できることは分かっています。ですから、次に取り組むべき最初のステップは、解決したい問題は何か、あるいは、見つけたい答えは何かを明らかにすることです。例えば、組織のどの部分を改善する必要があるでしょうか?あるいは、どのような意思決定を強化する必要があるでしょうか?そして、アナリティクス・ジャーニー全体の目標は何でしょう? 具体的には、例えば次のような疑問に答えを出すことになるでしょう。

  • 特定の品目の価格をいくらに設定すべきか?
  • 新しい製造プラントの立地はどこにすべきか?
  • 最新のカタログやパンフレットを誰に配付すべきか?
  • 個々の顧客にどのような利率を適用すべきか?
  • 特定の地域で顧客離れが顕著な理由は何か?

適切なデータと適切な分析モデルを使えば、これらをはじめとする幅広い疑問に答えを出すことができます。関連テクノロジーが目覚ましい進歩を遂げた現在では、データから知識と洞察を生み出すチャンスが、かつてない規模で広がっています。

 

アナリティクスの活用を始める方法

ほとんどの場合、アナリティクス・ジャーニーには、部門を横断したチームによる取り組みが必要となります。アナリティクスは反復型かつ対話型のプロセスであり、そのライフサイクル全体を管理することが重要です。アナリティクス・ライフサイクルのさまざまな段階には、さまざまなバックグラウンドやスキルを持つ担当者が関与することになります。最良の結果を出すためには、適切なスキルを備えた人材を適所に配置し、互いに協力して作業できる環境を整える必要があります。

  • ビジネスマネージャー:アナリティクスにもとづく洞察を必要としている問題や課題を特定し、分析結果にもとづいて意思決定を行い、その判断がもたらす結果をモニタリングします。
  • ビジネス分析担当者:データ探索とビジュアライゼーション(視覚化)を実行し、ビジネスの結果に影響を及ぼす重要な変数を特定します作業を担当します。
  • ITチームとデータ管理チーム:データの準備や、モデルの開発とモニタリングに関する側面を支援します。
  • データ・サイエンティストまたはデータマイニング担当者:より複雑な探索的分析、記述分析によるセグメンテーション、予測モデリングなどを実行します。
  • 組織によっては、アナリティクスにもとづく課題解決や洞察を求める声の高まりに対応するために、最高アナリティクス責任者(CAO)という役職を新設したり、多数のデータ・サイエンティストを雇用したりする動きも見られます。

アナリティクス・ジャーニーのガイドとなる反復型のライフサイクル

SASでは、アナリティクス・ジャーニーを反復型のステップに分解したものを「アナリティクス・ライフサイクル」と呼んでいます。

  • 課題の特定:このステップでは、業務部門/事業部門が、解決したいビジネス課題に関するニーズ、対象範囲、市場条件、目標を指定し、その結果として1つ以上のモデリング手法が選択されます。
  • 分析用データの準備:このステップでは、ビジネス課題と提案された分析手法に応じて、最適な結果を得るために必要なデータを特定し、専門的な手法を用いてそのデータのアクセス、クレンジング、準備を実行します。今日の企業や組織は多面的なデータを扱うようになっているため、トランザクション・システム、非構造化テキストファイル、データウェアハウスなどから幅広いデータを収集して使用する可能性があります。
  • データの探索:このステップでは、対話操作型のビジュアルな方法でデータを探索しながら、意味のある変数・傾向・関係を素早く特定します(変数をプロットすると「データの分布」と呼ばれる形状が現れ、この形状を使ってパターンを特定することができます)
  • データの変換とモデルの作成:このステップでは、適切なスキルを持つ分析担当者やモデリング担当者が、統計分析、データマイニング、テキストマイニングなどのソフトウェアを使ってモデルを作成します。この工程には、重要な変数の変換・選定を行うための機能も必須です。また、最良の結果を生むモデルをモデリング担当者が試行錯誤を通じて発見できるように、モデルを短時間で作成できる環境を整備することも重要です。
  • モデルのテストと検証:モデルの作成が済んだら、モデルの登録、テスト(または検証)、承認の手続きを経て、データに適用する準備が整ったことを宣言します。一元管理型のモデル・リポジトリを利用すれば、モデルに関する包括的なドキュメンテーション、スコアリング・コード、関連するメタデータ(データに関するデータ)を保管し、コラボレーション目的の共有や監査目的のバージョン管理を実現できます。
  • モデルの現場展開:本稼動環境での利用が承認されたら、モデルを新しいデータに適用して「予測的洞察」を導き出します。
  • モデルのモニタリングと評価:モデルの予測パフォーマンスをモニタリングして、モデルの最新性に問題がないかどうか、また適正な結果を導き出すかどうかを確認します。モデルのパフォーマンスが低下している場合は、改良を行うタイミングです。また、ビジネスニーズに合わなくなったモデルは廃止します。
analytical life cycle

アナリティクス・ライフサイクルは、競争優位性につながる「事実にもとづく洞察」を着実に導き出すために欠かせない各ステップを、順番に進めるためのガイドとして役立ちます。

 

SASがお勧めするアナリティクス・ソリューション