Abstract art - green with circle overlays

ディープ・ラーニングとは

ディープ・ラーニングとは、音声の認識、画像の特定、予測など人間が行うようなタスクを実行できるようにコンピューターに学習させる手法です。ディープ・ラーニングでは、人間がデータを編成して定義済みの数式にかけるのではなく、人間はデータに関する基本的なパラメータ設定のみを行い、その後は何層もの処理を用いたパターン認識を通じてコンピューター自体に課題の解決方法を学習させます。

今日の世界でディープ・ラーニングが重要な理由

ディープ・ラーニングは、コグニティブ・コンピューティングを支える基盤の一つです。ディープ・ラーニングへの関心が高まっている理由の一端は、コグニティブ・コンピューティングの周辺領域の一つとして、人間からの入力を理解し、人間のような形態や出力で応答するソフトウェア・アプリケーションに注目が集まっていることにあります。これまで数々のディープ・ラーニング手法によって、人間が対象を分類、認識、検知、記述する能力、一言でいえば「理解」する能力が大きく向上してきました。また、例えば画像の分類、音声の認識、物体の検出、コンテンツの説明など、こうした能力を数値以外のデータに適用するアプリケーションが数多くの分野で実用化されています。SiriやCortanaなどのパーソナル・アシスタントのシステムも、コグニティブ・コンピューティングがその技術基盤の一部となっており、ディープ・ラーニング手法を用いた機械学習を原動力としています。

今では、いくつもの技術発展がディープ・ラーニングの進化を後押ししています。まず、アルゴリズムの改良によってディープ・ラーニング手法のパフォーマンスが飛躍的に向上したほか、機械学習アプローチの精度向上によって多大なビジネス価値が生み出されるようになっています。また、テキスト翻訳や画像分類などの用途で特に効果を発揮する、新しい種類のニューラル・ネットワークも開発されています。ニューラル・ネットワークの歴史は半世紀近くに及びますが、1990年代後半は大規模なトレーニング・データが手に入らず実用的な精度を実現するのが難しかったことから、その人気は凋落していました。ところが、この10年間に起きた2つの変化がニューラル・ネットワークの用途に革命的な変化をもたらしました。

  1. 私たちは今、多数のレイヤー(層)が深く重なったニューラル・ネットワークを構築するのに十分な超大量のデータを利用できるようになっています。モノのインターネット(IoT)のストリーミング・データ、ソーシャルメディアのテキストデータ、医師の臨床メモ、保険調査員の記録などは、そうしたデータのごく一部です。
  2. 分散クラウド・コンピューティングおよびGPU(Graphics Processing Unit)という2つの領域における発展のおかげで、信じられないほど高度なコンピューティング・パワーを自在に操れるようになっています。ディープ・ラーニングのアルゴリズムの学習には、これらを最大限活用したコンピューティング・パワーが必要です。

同時に、人間とマシンの間を取り持つインターフェイスも、同じように大きな進化を遂げました。マウスとキーボードはジェスチャー、スワイプ、タッチ、自然言語などに取って代わられつつあり、そのことがコグニティブ・コンピューティングへの関心を再び活性化させています。

 

データ・サイエンスのイノベーション

SASのデータ・サイエンティストであるパトリック・ホール(Patrick Hall)が、ディープ・ラーニングの発展がテキスト認識機能の進化につながり、テキストの解読と理解、さらには生成さえも可能になることを説明します。

また、データ・サイエンスにおいて実現間近のブレークスルーには、他にどのようなものがあるのでしょうか?ディープ・ラーニング、マス・モデリング、画像認識、音声認識などの次なる動向について、第一線で活躍するデータ・サイエンティストの見解をお聞きください。


ディープ・ラーニングがもたらす機会と応用用途

ディープ・ラーニングのアルゴリズムが備える反復性、レイヤー数の増加がもたらす複雑性、ネットワークの学習に必要となるデータの大量性により、ディープ・ラーニングで課題を解決するには膨大なコンピューティング・パワーが必要になります。

従来のモデリング手法は人間が理解できるものであり、その予測手法やビジネスルールは説明可能です。一方、ディープ・ラーニング手法は、ブラックボックス的なアプローチと位置付けられてきました。この手法が正しく機能するかどうかは、新しいデータを対象にしたテストで証明するしかありません。とはいえ、その高度な非線形性という特徴ゆえに、特定の結果に至る理由を意思決定者に対して説明することは困難です。この点は、規制が厳しい業界を中心に、こうした手法の導入に対する抵抗感を生む可能性があります。

その一方で、これらの学習手法が持つ「継続的な改善を通じて情報パターンの変化に適応していくことが可能」というダイナミック性は、決定論的な硬直性が薄く柔軟性の高い行動様式をアナリティクスに取り込む大きなチャンスをもたらします。顧客分析におけるパーソナライズの高度化は、その可能性の1つと言えます。

もう1つの大きなチャンスは、ニューラル・ネットワークを長年にわたり活用してきた応用用途における精度とパフォーマンスの改善です。より優れたアルゴリズムと、より高度な処理能力があれば、分析をさらに深めていくことができます。

ディープ・ラーニング手法について現在の市場が注目しているのはコグニティブ・コンピューティングへの応用ですが、SASでは、例えば時系列分析など、アナリティクスの従来の応用用途における効果にも大きな可能性を見ています。

また、既存のアナリティクス業務の効率化・合理化が進むという点も、それ自体がチャンスと言えます。SASは最近、音声テキスト変換の課題にディープ・ニューラル・ネットワークを適用する実験に取り組みました。標準的な手法と比較すると、ディープ・ニューラル・ネットワークを適用した場合は、単語誤り率(WER)が10%以上も低下しました。また、データの前処理、特徴エンジニアリング、モデリングに関する10個のステップを除外することができました。コンピューティング処理の面では、ディープ・ニューラル・ネットワークの学習は従来のモデリング・フローよりも時間がかかるかもしれません。しかし、特徴エンジニアリングと比較した場合の圧倒的なパフォーマンス向上と時間の節約は、まさにパラタイム・シフトと言えます。

Abstract background - green with circle overlays

ディープ・ラーニングの最新動向

ディープ・ラーニングは既に大きなインパクトを世界にもたらしていますが、それはほんの始まりにすぎません。詳細については、このテーマに関する専門家の見解をご確認ください。

 
Interview

ディープ・ラーニングの手法と応用

AlphaGo(アルファ碁)から不正検知まで、ディープ・ラーニングは数多くの複雑な課題の解決に活用できるようになっています。このインタビュー記事では、SASでアナリティック・サーバー研究開発担当副社長を務めるオリバー・シャーベンバーガー(Oliver Schabenberger)が、標準的なアナリティクスとの違いについて実例を示しながら説明します。

インタビュー記事の要点を読む(ポップアップウィンドウが開きます)

Webinar

自然言語処理のためのディープ・ラーニング

ディープ・ラーニング手法を自然言語処理に適用する取り組みについて最新動向をご紹介します。米国ノースカロライナ州立大学でコンピューター・サイエンスを研究するジェームズ・C・レスター(James C. Lester)特別教授が、テキストの正規化をはじめとするトピックについて、SASのテキスト・アナリティクス担当ディレクターであるジェームズ・A・コックス(James A. Cox)と議論します(約13分)。

Webセミナーを閲覧

Blog

あらゆるもののデジタル化

「処理能力の増大が至る所で一気に進み、人工知能やディープ・ラーニングが新たな進展を遂げたことにより、私たちは[場所、ネットワーク、活動に関する]詳細なデータを収集するだけでなく、より的確に解釈できるようになっており、それが顧客理解の向上につながっています」と指摘するのは、経営コンサルタントのブライアン・ヴェルミュア(Brian Vellmure)氏です。

詳細を見る

ディープ・ラーニングの実用状況

外の世界から見ると、ディープ・ラーニングはまだ研究段階であり、コンピューター・サイエンス学者やデータ・サイエンティストたちがテストを続けているにすぎないと思われるかもしれません。しかし、ディープ・ラーニングには企業が利用中の実用的な用途が数多く存在しており、研究の進展につれて今後も続々と新たな用途が登場するでしょう。今日の一般的な用途としては、例えば以下のようなものがあります。

音声認識(スピーチ認識)

Bビジネス界、学術界の両方で、広い意味での「音声認識」(=スピーチ認識/発話認識)へのディープ・ラーニングの活用が進められています。Xbox、Skype、Google Now、AppleのSiri®などはその代表例ですが、こうしたシステムでは既に、人間の発話パターンや音声パターンを認識するためにディープ・ラーニング・テクノロジーを活用しています。

画像認識

画像認識の実用的な用途の1つは、画像に対するキャプションやシーンに対する説明文を自動的に付ける機能です。これは今後、警察などの捜査に不可欠となるでしょう。大勢の人で混み合う場所が犯罪現場となった場合、居合わせた人々から提供された何千枚もの写真を分析して犯行を特定するために役立ちます。自動運転車も、360度撮影に対応したカメラ技術の活用を通じて、画像認識のメリットを享受しています。

自然言語処理

ディープ・ラーニングの中核をなす要素であるニューラル・ネットワークは、もう何年も前から、書き留められたテキストの処理と分析に活用されてきました。この手法はテキストマイニングの専門特化した一形態であり、顧客のクレーム、医師の臨床メモ、報道レポートなど、幅広いテキスト情報からパターンを発見することができます。 

レコメンデーション・システム

AmazonやNetflixの取り組みで広く知られるようになったレコメンデーション・システムとは、過去の行動履歴にもとづき顧客が次に何に関心を示すかを高い精度で予測する手法です。ディープ・ラーニングを活用すると、興味のある音楽や衣料品の好みなどを複数のプラットフォームにまたがって判断するといった複雑な環境でも、レコメンデーションの効果を高めることができます。

 

Hand written data set numbers in different colors

考えるマシン:ディープ・ラーニングの実験

MNISTデータベースとは、手書きの数字の画像を大量に格納した公開データセットのことで、画像の処理と解読がいかに複雑であるかを示す機械学習研究の古典的な課題として広く利用されています。

このWebセミナーでは、「0」「1」「2」など1桁の手書き数字の画像を大量に含むこのデータセットが今後のディープ・ラーニング研究にも利用できることを説明した上で、このデータにディープ・ラーニングを適用する実例を示し、その結果から明らかになった知見を紹介します。

ディープ・ラーニングのWebセミナーを視聴


     

Data Mining Enterprise Miner

 

SASの高度なアナリティクス

ディープ・ラーニングはデータ・サイエンティストのツールキットに含まれる1つの手法にすぎません。予測、テキスト分析、最適化など、その他の高度なアナリティクス手法についても、ぜひ詳細をご確認ください。

SASのアナリティクス・ソリューションの詳細

ディープ・ラーニングの仕組み

ディープ・ラーニングは、アナリティクスで解決しようとする課題の提示方法に関する考えを一変させます。この手法では、課題の解決方法をコンピューターに指示するのではなく、課題を自律的に解決できるようにコンピューターに学習させます。

 

従来のアプローチでは、既存のデータを用い、特徴エンジニアリングによって新しい変数を導き出し、適切と思われる分析モデルを選択した上で、最終的にそのモデルのパラメータ(つまり未知の係数値)を推定します。このような手法で予測システムを構築することは可能ですが、完全性や正確性はモデルとその特徴のクオリティに大きく依存するため、なかなかうまく一般化することができません。例えば、特徴エンジニアリングで不正対策モデルを開発する場合は、何らかの変数セットを出発点とし、データ変換手法を用いてこれらの変数からモデルを導き出す方法が一般的でしょう。その結果、例えば3万個の変数に依存するモデルが得られたとすると、有意な変数とそうではない変数の選別などを通してモデルのシェイプアップも行わなければなりません。そして、新しいデータを追加するたびに、以上の全てを繰り返す必要があります。

ディープ・ラーニングによる新しいアプローチでは、人間がモデルの数式化や仕様記述を行う代わりに、適切に階層化されたレイヤー群を用いて、そこに見られる規則性から、データに潜む特徴を明らかにしていく方法を学習させます。

ディープ・ラーニングがもたらすパラダイム・シフトは、特徴エンジニアリングから特徴表現への移行と言えます。

ディープ・ラーニングの前提そして約束は、一般化と適応が良好に行われ、新しいデータに合わせた継続的な改善も可能で、ハード・コーディングされた決定論的なビジネスルールにもとづいて構築される予測システムよりもダイナミックな予測システムを構築できることです。この手法では、人間がデータにモデルを当てはめるのではなく、データを用いた学習作業をソフトウェアに課すのです。

高度なアナリティクスに関する他のインサイト

Back to Top