コンピューター・ビジョン
概要と重要性
コンピューター・ビジョンの歴史
コンピューター・ビジョンの初期の実験は1950年代に行われ、物体の輪郭を検出する目的や、単純な物体を円や四角形のようなカテゴリーに分類する目的で、いくつかの初期的なニューラル・ネットワークを利用しました。1970年代には、コンピューター・ビジョンの最初の商業利用が行われ、光学式文字認識を用いてタイプライターや手書きのテキストを解釈しました。この進歩は、書かれたテキストを盲人向けに解釈するために利用されました。
1990年代、インターネットの成熟に伴い、分析向けの大規模な画像セットがオンラインで入手可能となり、顔認識プログラムの研究が盛んになりました。これらのデータセットの成長は、マシンが写真や動画から特定の人物を識別できるようにする取り組みに役立ちました。
今日では、次のような数多くの要因が収斂した結果、コンピューター・ビジョンの “ルネサンス” が生じています。
内蔵カメラを搭載したモバイル・テクノロジーにより、世界には写真や動画が満ちあふれています。
コンピューティング・パワーは、より低コストかつ容易に利用できるようになっています。
コンピューター・ビジョンおよび分析用に設計されたハードウェアが、より広く入手可能になっています。
畳み込みニューラル・ネットワークのような新しいアルゴリズムが、ハードウェアやソフトウェアの機能を有効活用します。
これらの進歩がコンピューター・ビジョン分野にもたらした影響は驚異的でした。物体識別や物体分類の精度は10年足らずで50%から99%へと向上しました。そして、今日のシステムは、ビジュアル入力を対象とした高速な検出タスクや反応タスクに関しては、人間よりも正確です。
コンピューター・ビジョンはジグソーパズルに似ている
コンピューターは、人間がジグソーパズルを完成させるのと同じ要領でビジュアル画像を組み立てます。
人間がジグソーパズルに取り組む方法を考えてみてください。あなたは全てのピースを持っており、それらを1枚の画像に組み立てる必要があります。まさにそれが、コンピューター・ビジョン向けのニューラル・ネットワークの動作方法であり、画像を構成する多種多様なピースを区別し、輪郭を識別した上で、画像のサブコンポーネント(=画像を構成する物体など)をモデル化するのです。こうしたニューラル・ネットワークは、ディープな(=何重もの)ネットワーク層を通じたフィルタリングと一連のアクションを用いて、人間がパズルに取り組む場合とほぼ同様に、画像の全てのパーツをまとめ上げることができます。
コンピューターは、パズルの箱の上面にある完成見本の画像を与えられることはありませんが、多くの場合は、特定の物体(群)を認識できるようトレーニングするための数百または数千の関連画像が供給されます。
プログラマーは、猫を認識させるためにヒゲや尻尾、とがった耳を探すようにコンピューターをトレーニングするのではなく、数百万枚もの猫の写真をアップロードします。すると、モデルは、猫を構成する様々な特徴を自力で学習します。
コンピューター・ビジョンの最新動向
顔の認識から、サッカーの試合における生の動きの処理に至るまで、多くの領域でコンピューター・ビジョンは人間の視覚能力に匹敵し、それを凌駕します。
ディープ・ラーニングとコンピューター・ビジョン
ディープ・ラーニングはどのようにして、コンピューターに “見ること” をトレーニングするのでしょう? 様々なタイプのニューラル・ネットワークが動作する仕組みと、それらをコンピューター・ビジョンに活用する方法とは?
顔認識のデモ
顔認識とコンピューター・ビジョンに必要とされる基本テクニックとデータ処理ステップとは? このデモでは、SAS® Viya® で作成したモデルが、顔画像の検出、角度調整、表現、分類を行う方法を紹介します。
コンピューター・ビジョンの業種別用途
コンピューター・ビジョンは、消費者エクスペリエンスの向上、コストの削減、セキュリティの強化などのために、様々な業種で利用されています。
製造
製造業界では、製品の欠陥をリアルタイムで特定するためにコンピューター・ビジョンを活用しています。製品が生産ラインを流れている間に、コンピューターは画像や映像を処理し、数十種類の欠陥についてフラグを立てます。極めて小さな製品にも対応できます。
医療
医療分野におけるコンピューター・ビジョン・システムは、MRI/CATスキャン/レントゲンの撮影画像を徹底的に検査し、人間の医師と同等以上の正確性で異常を検出します。また、医療専門家は、心臓の鼓動やその他における視覚的な差異を検出する目的で、超音波検査などの3次元画像に対してもニューラル・ネットワークを利用します。
保険
保険業界では、事故車両の損害状況評価における一貫性と正確性を高めるためにコンピューター・ビジョンを利用しています。この進歩は、不正の削減、保険金請求対応プロセスの合理化/効率化を促進しています。
防衛・セキュリティ
銀行やカジノのように高度なセキュリティが必須の環境では、大量の資金が交換される際に顧客の本人確認の精度を高める目的で、コンピューター・ビジョンを利用しています。警備担当者には数百件の映像を同時に分析することは不可能ですが、コンピューター・ビジョンのアルゴリズムなら可能です。
コンピューター・ビジョンは、ディープ・ラーニングと人工知能の世界から生まれた最も画期的な成果の一つです。ディープ・ラーニングがコンピューター・ビジョンにもたらした数々の進歩が、この分野を本当に際立たせています。 ウェイン・トンプソン(Wayne Thompson) SASデータ・サイエンティスト
動物保護のためのコンピューター・ビジョン
L動物の足跡を分析するために設計されたコンピューター・ビジョン・モデルは、どのように機能するのでしょう? 原住民の動物追跡者のように足跡を認識する能力を、コンピューターに学習させることは可能なのでしょうか? コンピューターが動物の種類と性別を判断するために様々な情報レイヤーを処理する方法をご確認ください。このビデオでは、SASのアドバンスト・アナリティクス研究開発部門シニア・マネージャー、ジャレッド・ピーターソン(Jared Peterson)が、ニューラル・ネットワークがコンピューター・ビジョンを背後で支えるサイエンスである理由を示します。
コンピューター・ビジョンの仕組み
コンピューター・ビジョンは3つの基本的なステップで機能します。
画像の取得
分析用の画像の取得は、たとえ大規模なセットの場合でも、動画、写真、または3Dテクノロジーを通じてリアルタイムで行えます。
画像の処理
ディープ・ラーニング・モデルはこのプロセスの大部分を自動化しますが、モデルのトレーニングは、多くの場合、最初に数千枚のラベル付き画像(=事前に識別済みの画像)を供給することによって実施します。
画像の理解
最後のステップは解釈のステップです。ここでは物体を識別または分類します。
今日のAIシステムは、もう一歩先に進んでおり、画像の理解に基づいて様々なアクションを実行することも可能です。コンピューター・ビジョンには、異なる方法で利用される多様なタイプがあります。
- 画像セグメンテーションは、画像を「個別に精査するための複数の区域または部分」に分割します。
- 物体検出は、画像内にある特定の物体を識別します。高度な物体検出は、1枚の画像内にある多数の物体を認識します(例:サッカーのピッチ、攻撃的選手、守備的選手、ボール、その他)。これらのモデルは、X/Y座標を用いて境界ボックスを作成し、ボックス内部にある全てのものを識別します。
- 顔認識は高度なタイプの物体検出であり、画像内で人間の顔を認識するだけでなく、特定の個人の識別も行います。
- エッジ検出は、画像内に何があるかをより的確に識別する目的で、物体や風景の輪郭を識別するために利用される技法です。
- パターン検出は、画像内に繰り返し現れる形状、色、その他の視覚的目印を認識するプロセスです。
- 画像分類は、画像を異なるカテゴリーにグループ化します。
- 特徴マッチングはパターン検出の一種であり、画像の分類に役立てるために画像内の類似性を照合します。
コンピューター・ビジョンのシンプルな応用用途では、これらの技法を1つだけ利用する場合もありますが、より高度な用途(自動運転車向けのコンピューター・ビジョンなど)では、複数の技法を活用して目標を達成します。
コンピューター・ビジョン向けの注目製品
SAS® Visual Data Mining and Machine Learning
このSASソリューションは、ディープ・ラーニングに加えて、クラスタリング、多種多様な回帰手法、ランダムフォレスト、勾配ブースティング・モデル、サポート・ベクター・マシン(SVM)、センチメント分析などをサポートしています。【レビューで書換】モデルはプロジェクトという単位で管理され、モデル生成プロセスはビジュアルなパイプラインとして描き実行することができます。パイプラインは複数の機能ノードで構成され、色分けして表示されます。
お勧めの資料
- Article オープンなAIプラットフォーム - SAS ViyaSAS® Viya®は、一つの環境でアナリティクスに必要な機能を全て実現したクラウド対応のプラットフォームです。アジャイルなIT環境に欠かせない高い信頼性、スケーラビリティ、セキュリティを備えたアナリティクス環境とガバナンスを提供することにより、 データ・サイエンティストからビジネス・アナリスト、アプリケーション開発者、そして経営幹部まで、あらゆる人々のニーズに対応します。
- Article AIマーケティング: どのような未来を秘めているのか?AIマーケティングとは、人工知能(AI)とアナリティクスを活用してリアルタイム・パーソナライゼーションでカスタマー・エクスペリエンスを強化しながら、マーケティング結果の改善を図る取り組みのことです。
- Article サプライチェーンの成功のためにAIと機械学習を活用する方法