Blue Abstract art

ビッグデータ

概要と重要性

ビッグデータとは、構造化データか非構造化データかを問わず、ビジネスや研究の現場に溢れている大量のデータを意味する用語です。しかし、重要なのはデータの量ではなく、そのデータを使って何をするかです。ビッグデータを分析すると、より優れた意思決定や戦略的なビジネス行動へとつながる洞察を導き出すことができます。

ビッグデータの歴史と現在の考慮事項

「ビッグデータ」は比較的新しい用語ですが、最終的に分析する目的で大量の情報を収集・保管するという取り組み自体には、それよりも長い歴史があります。この概念が普及したきっかけは、2000年代初めに業界アナリストのダグ・レイニー(Doug Laney)氏が、現在主流となっているビッグデータの定義を3つのVで表現したことでした。

  • 量(volume):企業や組織は、ビジネス・トランザクション、ソーシャルメディア、センサー、マシン間(M2M)通信など、幅広いソースからデータを収集するようになっています。こうした大量のデータを保管することは以前は難問でしたが、新しいテクノロジー(Hadoopなど)によって、その負担は軽減されています。
  • 速度(velocity):データは以前なら想像もできなかった速度で流れており、適切なタイミングで取り扱わなければなりません。RFIDタグ、センサー、スマートメーターなどの普及を受け、怒濤のように押し寄せるデータをほぼリアルタイムで処理する必要性が高まっています。
  • 多様性(variety):データの種類も増え続けています。従来型データベースに格納された数値などの構造化データから、テキスト文書、電子メール、ビデオ、オーディオ、株価ティッカーなどの非構造化データや金融取引データまで、企業や組織はあらゆるフォーマットのデータを取り扱う必要があります。

ビッグデータついて考える場合、SASでは次の2つの次元を加えます。

  • 変動性(variability):データの速度と多様性が増大していることに加え、データフローの安定性が失われ、周期的なピークの想定を超えて大きく変動するケースが増えています。ソーシャルメディア内のトレンドが原因の場合もあるでしょう。日替わり、季節単位、あるいはイベントの影響などでピーク負荷が変動すると、データを管理するのは難しくなります。そこに非構造化データが含まれる場合、状況はさらに悪化します。
  • 複雑性(complexity):今日、データは複数のソースから収集されるのが普通になっており、システム間でデータをリンク、照合、クレンジング、変換する作業が難しくなっています。しかし、ビッグデータを活用するためには、関係、階層構造、複数のデータ系統を結びつけて相関させる必要があり、さもないと、すぐに膨大なデータをコントロールできなくなってしまいます。

ビッグデータに秘められた大きな可能性

地球上で作成・保管されているデータの量は想像もつかない規模に達しており、今この瞬間も増え続けています。これはビジネス情報から重要な洞察を導き出せる可能性が広がり続けていることを意味しますが、実際に分析されているのはデータのごく一部にすぎません。このことはビジネスにとって、どのような意味を持つのでしょう? 日々流れ込んでくる生の情報をより効果的に活用するためには、どうすればよいのでしょうか?

ビッグデータが重要な理由

ビッグデータ活用において重要なのは、どれほど大量のデータを持っているかではなく、それを使って何をするかにあります。あらゆるソースからデータを取得して分析することで、目標の達成につながる答えを見つけることができます。主な目標としては、1) コスト削減、2) 時間の節約、3) 新製品の開発と市場投入の最適化、4) 意思決定のスマート化、などが挙げられます。ビッグデータを強力なアナリティクス機能と組み合わせると、ビジネスに関連する以下のようなタスクを達成できます。

  • 障害、問題、欠陥の根本原因をほぼリアルタイムで特定
  • 顧客の購入傾向にもとづき、販売時点で割引クーポンを発行
  • 総合的なリスク・ポートフォリオをごく短時間で再計算
  • 組織に悪影響が及ぶ前に不正な行動を検出

今日の世界におけるビッグデータ

ビッグデータと、それを適切に管理して洞察を引き出す手法が今、この世界におけるビジネス情報の活用方法を変革しつつあります。以下の資料では、ビッグデータの影響をより具体的にご確認いただけます。

 
White Paper

中堅企業におけるビッグデータの活用方法

データの分析と視覚化(ビジュアライゼーション)から実用的な結果を引き出し、競争優位性を獲得する方法について、7つの実践的なヒントをご紹介します。

ホワイトペーパーを読む(英語)

White Paper

ビジネス担当者のためのビッグデータ攻略本

このホワイトペーパーは、基本的には技術に詳しいものの専門家とまではいえないビジネス担当者を対象として、Hadoopの活用方法と企業における今後のデータ環境に及ぼす影響を解説しています。
要約を読む(ポップアップウィンドウが開きます)

Book

ビッグデータとデータマイニング

データマイニング専門家のジャレッド・ディーン(Jared Dean)氏がデータマイニングについて執筆した著書をご紹介します。ハイパフォーマンス・コンピューティングと高度なアナリティクスを活用して、アナリティクス・プログラムの効果を最大限に高めるにはどうすればよいかが論じられています。

要約を読む(ポップアップウィンドウが開きます)

SAS Visual Analytics screenshot on monitor


ビッグデータ活用環境にHadoopを追加したいとお考えでしょうか?

SASは、全てのデータから貴重な洞察を導き出すのに必要な機能を全て提供しています。

SASのビッグデータ対応ソリューション

業種別のビッグデータ活用法

ビッグデータは事実上あらゆる業種の企業・組織に影響を及ぼします。それぞれの業種では、こうした膨大な情報から、どのようにメリットを引き出すことができるのでしょうか?

銀行

大量の情報が無数のソースから流れ込んでくる中、銀行はビッグデータ管理の革新的な方法を見出す必要性に直面しています。顧客を理解し、その満足度を高めることは重要ですが、法規制コンプライアンスを維持しながらリスクと不正行為を最小限に抑えることも同じように重要です。ビッグデータは多大な洞察をもたらしますが、金融機関が常に競争相手の一歩先を行くためには、高度なアナリティクスを活用する必要があります。

教育

データにもとづく洞察を活用すれば、教育関係者は学校のシステム、学生、カリキュラムに多大な好影響をもたらすことができます。ビッグデータの分析は、手助けを必要としている学生の特定、効果的で着実な成果を生む指導方法の確立、教員や校長の評価・支援システムの改善/導入に効果を発揮します。

官公庁

アナリティクスとビッグデータを効果的に活用すれば、官公庁は公益事業の経営、行政機関の運営、交通渋滞への対処、犯罪の防止など、幅広い領域で強固な行政基盤を築くことができます。ただし、ビッグデータは多くのメリットをもたらしますが、行政の透明性や個人情報の保護にも適切に対応しなければなりません。

医療

患者の診療記録から、治療の計画、処方薬の情報まで、医療業界では膨大な情報を扱います。医療の現場では、あらゆることを迅速かつ正確に実行する必要があり、場合によっては、厳格な業界規制に準拠した透明性を確保することも必要になります。ビッグデータを効果的に管理・活用すれば、医療機関は治療の改善につながる新たな洞察を明らかにすることができます。

製造

製造企業はビッグデータがもたらす洞察を活用することで、無駄を最小限に減らしながら、品質と生産量を飛躍的に高めることができます。こうした取り組みは、競争が厳しい今日の市場を生き抜くためのカギとなります。製造業界ではアナリティクス重視の文化を取り入れる企業が増え続けており、業界全体で課題解決の迅速化、意思決定の俊敏化が進んでいます。

小売

小売業界では顧客と緊密な関係を築くことが極めて重要であり、この課題に取り組む最良の方法は、ビッグデータを適切に管理・活用することです。小売企業は、顧客セグメントや「個客」に対する最良のマーケティング方法、最も効果的な取引方法、離れた顧客を取り戻す最良の戦略を知る必要があります。ビッグデータは、こうした取り組みの中核を支えます。

ビッグデータの活用事例:UPS社

数多くの業務要素が常に動き続けている貨物運送会社として、UPS社は大量のデータを保管していますが、その大半は営業用車両に搭載されたセンサーから流入します。このデータは、日常の運行パフォーマンスの監視に役立っているだけでなく、ドライバーの配送ルート体系を大刷新する構想の契機にもなりました。この構想はORION (On-Road Integration Optimization and Navigation) と呼ばれ、恐らく世界最大の車両運用調査研究プロジェクトといっても過言ではありません。この取り組みでは、ドライバーの集荷/配達スケジュールをリアルタイムで再調整するために、オンライン地図データも重要な構成要素となりました。

このプロジェクトにより、1日の配送ルートは約1億3,600万キロメートルも短縮され、約3,200万リットル以上の燃料の節約が実現しました。UPS社では、1日にドライバー1名あたり1マイル(約1.6キロメートル)を短縮するだけで経費を3,000万ドル節約できると見積もっており、節約の総額は相当な規模になります。

忘れてはならない重要な点は、ビッグデータの主要な価値を現実化するのは、生データ自体ではなく、それを処理および分析するプロセスと、そこから生まれる洞察、製品、サービスである、ということです。ビッグデータを活用するためにはテクノロジーと管理アプローチを刷新するだけでなく、それと同時並行で、意思決定や製品/サービスのイノベーションにデータを活用する方法についても、同様に劇的なシフトを成し遂げる必要があります。
トーマス・H・ダベンポート(Thomas H. Davenport)、
 Big Data in Big Companies(大企業におけるビッグデータ)より
SAS Visual Analytics screenshot on monitor


データの探索と視覚化

SASを活用すれば、データに秘められた意味を容易に明らかにすることができます。数十億件規模のデータも対話操作で数秒で探索可能です。

SASのビッグデータソリューション

仕組み

ビジネスでビッグデータを活用する方法を知るためには、まず、ビッグデータの発生元を理解しておく必要があります。ビッグデータのソースは一般に、次の3つのカテゴリーに分類されます。

ストリーミング・データ

このカテゴリーに含まれるのは、ネットワークに接続された多種多様なデバイスから社内のITシステムに届くデータです。通常は、このデータを到着時点で分析し、保持する必要のあるデータ、保持する必要のないデータ、さらなる分析を必要とするデータを判別します。

ソーシャルメディアのデータ

ソーシャルメディアの対話データは、特にマーケティング、セールス、顧客サポートの領域において、より魅力定な情報源として認識されるようになっています。このデータは非構造化または半構造化の形態になっている場合が多いため、利用と分析に際しては、この種のデータに特有の課題を克服する必要があります。

公開されている情報ソース

現在では、米国政府のdata.gov、CIAのWorld Factbook(各国要覧)、欧州連合(EU)のOpen Data Portalといったオープンデータ・ソースから、大量のデータを入手できるようになっています。

利用できる可能性のあるデータソースを全て特定したら、次は、情報活用を開始する前に決めておくべき事項を検討します。次のような事項があります。

情報を保管・管理する方法

数年前はストレージ容量が大きな問題の1つでしたが、現在ではデータ保管に関して低コストの選択肢があります。ただし、それが自社のビジネスにとって最良の戦略かどうかの検討は必要です。

分析対象とするデータの範囲

企業によっては、いかなるデータも分析から除外しないようになっています。これはグリッド・コンピューティングやインメモリ・アナリティクスなど、最新のハイパフォーマンス・テクノロジーを活用することで実現できます。それに代わるアプローチは、分析目的に適したデータ範囲を事前に決定することです。

導き出した洞察を活用する方法

知識が増えるほど、より大きな確信を持って意思決定できるようになります。大量の情報を利用できる環境が整ったら、それを効果的に活用するための戦略を立てることが賢明です。

ビジネスでビッグデータを活用するための最後のステップは、ビッグデータとビッグデータ・アナリティクスを最大限に活用するのに役立つテクノロジーを調査することです。以下の点を考えてみてください。

  • 安価で大容量のストレージ
  • より高速なプロセッサー
  • オープンソースでリーズナブルな価格の分散ビッグデータ・プラットフォーム(例:Hadoop)
  • 並列処理、クラスタリング、MPP(超並列処理)、仮想化、大規模グリッド環境、高度な接続性、高スループット
  • クラウド・コンピューティングやその他の柔軟なリソース配分調整手法

Back to Top