Computer Vision
Présentation et atouts
Le Computer Vision est une branche de l'intelligence artificielle qui entraîne les ordinateurs à interpréter et comprendre le monde visuel. En se servant des images numériques des caméras et des vidéos et des modèles de deep learning, les machines identifient et classent précisément les objets, puis réagissent à ce qu'elles « voient ».
Histoire du computer vision
Les premières expériences d'analyse d'image se sont déroulées dans les années 1950 et ont utilisé les réseaux de neurones pour la première fois pour détecter les contours d'un objet et trier des objets simples dans des catégories comme les cercles et les carrés. Dans les années 1970, le premier usage commercial de l'analyse d'image par ordinateur a consisté à interpréter du texte dactylographié ou manuscrit en s'appuyant sur la reconnaissance optique de caractères. Cette avancée a rendu possible l'interprétation des textes écrits pour les non-voyants.
Avec l'apparition d'Internet dans les années 1990, les images disponibles en ligne pour l'analyse et les programmes de reconnaissance faciale se sont multipliées. Ce volume croissant de données a permis aux machines d'identifier des personnes spécifiques dans des supports photos et vidéos.
Aujourd'hui, plusieurs facteurs convergents relancent l'intérêt pour l'analyse d'image :
La technologie des appareils mobiles avec caméras intégrées a saturé le monde de photos et de vidéos.
La puissance de calcul est devenue plus abordable et facilement accessible.
Les équipements matériels conçus pour l'analyse d'image sont plus largement accessibles.
De nouveaux algorithmes tels que les réseaux neuronaux convolutifs peuvent tirer parti des capacités matérielles et logicielles.
Les effets des avancées dans le domaine de l'analyse d'image ont été stupéfiants. En moins de 10 ans, les taux de précision d'identification et de classification des objets sont passés de 50 à 99 %. Par ailleurs, les systèmes actuels sont plus précis que les humains lorsqu'il s'agit de détecter et de réagir rapidement aux entrées visuelles.
Une nouvelle ère pour le traitement du cancer
Les méthodes classiques d'évaluation des tumeurs cancéreuses sont incroyablement chronophages. Sachant qu'elles reposent sur une quantité limitée de données, elles sont sujettes aux erreurs et particulièrement subjectives. Avec l'aide de SAS, Amsterdam UMC a transformé l'évaluation des tumeurs par le biais de l'intelligence artificielle. Les médecins utilisent la technologie de l'analyse d'image et les modèles de deep learning pour accélérer l'analyse des réponses à la chimiothérapie. Ils peuvent ainsi identifier plus rapidement les patients prêts pour une intervention chirurgicale, avec une précision qui peut leur sauver la vie.
Découvrez pourquoi Georgia-Pacific a choisi SAS
L'analyse d'image est comme un puzzle
Les ordinateurs assemblent des images tout comme vous assemblez les pièces d'un puzzle.
Imaginez-vous un puzzle. Pour former une image, vous devez assembler toutes les pièces. Les réseaux de neurones d'analyse d'image fonctionnent sur le même principe. Ils distinguent les nombreuses éléments de l'image, identifient les contours et modélisent les sous-composants. À l'aide de filtres et d'une série d'actions appliquées sur les couches profondes du réseau, ils rassemblent toutes les pièces de l'image, comme dans un puzzle.
L'ordinateur ne voit pas l'image finale sur le couvercle de la boîte de puzzle, mais il est alimenté en centaines ou milliers d'images associées qui l'entraînent à reconnaître des objets spécifiques.
Plutôt que d'entraîner les ordinateurs à rechercher des moustaches, des queues et des oreilles pointues pour reconnaître un chat, les programmeurs chargent des millions de photos de chats et laissent le modèle apprendre seul les différentes caractéristiques d'un chat.
L'analyse d'image dans le monde actuel
De la reconnaissance faciale au traitement des actions de jeu lors d'un match de football, l'analyse d'image surpasse les capacités visuelles humaines dans de nombreux domaines.
Deep learning et analyse d'image
Comment l'apprentissage profond entraîne-t-il un ordinateur à voir ? Découvrez les techniques et les applications du deep learning et apprenez comment les différents types de modèles de réseaux neuronaux profonds sont utilisés pour la vision par ordinateur.
Une autre paire d'yeux avec le computer vision
Georgia-Pacific a intégré le computer vision dans les opérations de fabrication quotidiennes afin de capturer et d'analyser les données d'image. En surveillant constamment les anomalies, la technologie aide à résoudre les problèmes de qualité et de sécurité et à accroître l'efficacité.
THE BATTING LAB
Le Batting Lab combine l'IA, le computer vision et l'analyse IoT avec le baseball pour aider les enfants à améliorer leurs swings et leur maîtrise des données. Les capteurs et les caméras utilisent la détection d'objets pour collecter des points de données et traiter les séquences, créant ainsi des recommandations en temps réel pour les batteurs.
Qui utilise la Computer Vision ?
L'analyse d'images est utilisée dans tous les secteurs d'activité pour améliorer l'expérience client, réduire les coûts et renforcer la sécurité.
- Sélectionnez un secteur d'activité
- Grande distribution
- Industrie
- Administration
- Santé
- Défense et sécurité
- Assurance
Grande distribution
Les enseignes de la distribution peuvent utiliser l'analyse d'images pour améliorer l'expérience d'achat, réduire les pertes et détecter les problèmes de rupture de stock. L'analyse d'images permet d'ores et déjà aux clients de régler plus rapidement leurs achats, via les caisses automatiques ou avec l'aide du machine learning, ce qui simplifie considérablement le processus de paiement.
Industrie
Dans le manufacturing, les entreprises utilisent l'analyse d'images pour identifier les défauts des produits en temps réel. L'ordinateur traite les images ou les vidéos des produits à la sortie de la chaîne de production et signale des dizaines de types d'anomalies, y compris sur les produits les plus petits.
Administration
Les administrations publiques utilisent l'analyse d'images pour mieux comprendre la condition physique des équipements et des infrastructures qu'elles contrôlent. Grâce à l'analyse d'images des infrastructures et des équipements, elles peuvent anticiper des décisions de maintenance. Elles utilisent en outre l'analyse d'images pour respecter la conformité avec les politiques et les réglementations. C'est ainsi, par exemple, qu'ils détectent la contrebande dans les cargaisons, identifient de potentielles infractions à la sécurité dans les bâtiments, examinent les étiquettes pour vérifier le respect des directives et s'assurent de la conformité avec les réglementations en matière de conservation. Enfin, à l'heure où les drones deviennent indissociables des stratégies de défense et de sécurité intérieure, le recours à l'analyse d'images pour identifier et analyser les éléments critiques d'un flux visuel sera de plus en plus fréquent dans le secteur public.
Santé
Dans le secteur médical, les systèmes de vision assistée par ordinateur examinent minutieusement les images des IRM, des scanners et des radiographies pour détecter des anomalies avec autant de précision que les médecins. Les professionnels de santé utilisent également les réseaux de neurones sur des images en trois dimensions comme les ultrasons pour détecter des différences visuelles dans le rythme cardiaque, par exemple.
Défense et sécurité
Dans les environnements très sécurisés comme les banques ou les casinos, l'analyse d'images est utilisée pour identifier avec précision les clients lors de l'échange de sommes d'argent importantes. S'il est impossible pour les agents de sécurité d'analyser des centaines de flux vidéo à la fois, un algorithme d'analyse d'images peut le faire.
Assurance
Dans le secteur des assurances, les compagnies utilisent l'analyse d'images pour procéder à des évaluations plus cohérentes et plus précises des véhicules endommagés, ce qui contribue à réduire les fraudes et à simplifier le processus de réclamation.
L'analyse d'image est l'une des fonctionnalités les plus remarquables offertes par le deep learning et l'intelligence artificielle. Le deep learning a largement contribué aux avancées dans ce domaine.
Découvrez le domaine multidisciplinaire de la data science
L'analyse d'images pour la préservation des animaux
Découvrez le fonctionnement de l'analyse d'image pour analyser les traces d'animaux. L'ordinateur peut-il être entraîné à repérer une empreinte comme le fait un pisteur d'animaux ? Découvrez comment l'ordinateur traite les différentes couches d'informations pour déterminer l'animal et son genre. Dans cette vidéo, Jared Peterson, responsable senior du pôle R&D en analytique avancée chez SAS, explique comment les réseaux de neurones permettent à l'analyse d'image de fonctionner.
Résultats obtenus par l'analyse d'images
Les applications d'analyse d'images produisent des résultats dans de multiples secteurs et nous avons les recensées dans cette infographie. Par exemple, saviez-vous que :
- L'analyse d'images pouvait faire la différence entre les dommages automobiles réels et ceux mis en scène ?
- L'analyse d'images permet la reconnaissance faciale à des fins de sécurité ?
- L'analyse d'images rend possible le paiement automatique en caisse dans les magasins ?
De l'identification des défauts de fabrication à la détection des signes précurseurs de maladies dans l'agriculture, l'analyse d'images est utilisée dans plus de domaines qu'on ne pourrait l'imaginer.
Cliquez sur l'infographie pour voir les applications dans les secteurs de la grande distribution, de la banque, de la santé, etc.
Fonctionnement de l'analyse d'image
Les trois étapes élémentaires de l'analyse d'image :
Acquisition d'une image
De très nombreuses images peuvent être acquises en temps réel via les vidéos, les photos et la technologie 3D, à des fins d'analyse.
Traitement de l'image
Les modèles de deep learning automatisent une grande partie de ce processus, mais ils sont souvent entraînés dans un premier temps par l'intégration de milliers d'images étiquetées ou pré-identifiées.
Interprétation de l'image
L'étape finale est celle de l'interprétation, qui consiste à identifier ou à classer un objet.
L'IA permet d'aller plus loin et de prendre des décisions basées sur l'analyse d'image. L'analyse d'image se décline sous de nombreuses formes, exploitables de différentes manières :
- La segmentation d'image partitionne une image en plusieurs régions ou éléments, qui sont examinés séparément.
- La détection d'objet identifie un objet spécifique dans une image. La détection avancée d'objet reconnaît de nombreux objets dans une seule image : un terrain de football, un attaquant, un défenseur, un ballon, etc. Ces modèles utilisent un système d'axes X,Y pour créer un cadre et identifier tout ce qui se trouve à l'intérieur.
- La reconnaissance faciale est une forme avancée de la détection d'objet qui reconnaît non seulement un visage humain dans une image, mais identifie un individu spécifique.
- La détection des contours est une technique utilisée pour identifier le bord extérieur d'un objet ou d'un paysage afin de mieux discerner le contenu de l'image.
- La détection de schéma est un processus de reconnaissance des formes, des couleurs et des autres indicateurs visuels récurrents dans les images.
- La classification d'image regroupe les images en différentes catégories.
- Le "feature matching" est un type de détection de pattern qui met en correspondance les similarités au sein des images pour faciliter leur classification.
Les applications simples de l'analyse d'image n'utilisent parfois qu'une seule de ces techniques, mais des applications plus avancées, comme l'analyse embarquée dans les voitures autonomes, s'appuient sur plusieurs techniques pour atteindre leur objectif.
Étapes suivantes
Jugez par vous-même. Découvrez ce que vous pouvez faire avec SAS pour l'analyse d'image.
Solution pour l'analyse d'image
SAS® Visual Data Mining and Machine Learning
Cette solution SAS prend en charge le deep learning, mais aussi la clusterisation, différents types de régression, les forêts aléatoires, les modèles de gradient boosting, les machines "vector support", l'analyse de sentiment, etc. Un environnement de pipeline visuel interactif présente chaque projet (ou objectif) sous la forme d'une série d'étapes avec des codes de couleur, se déroulant dans un ordre logique.
Lecture recommandée
- ARTICLE Qu'est-ce qu'un chatbot ?Un chatbot est une forme d'IA conversationnelle conçue pour simplifier l'interaction entre l'homme et l'ordinateur. Découvrez comment les chatbots sont utilisés dans les entreprises et comment ils peuvent être intégrés dans les applications analytiques.
- ARTICLE The untapped potential in unstructured textText is the largest human-generated data source. It grows every day as we post on social media, interact with chatbots and digital assistants, send emails, conduct business online, generate reports and essentially document our daily thoughts and activities using computers and mobile devices.
- ARTICLE Marketing et IA : que réserve l'avenir ?L'IA pour le marketing s'appuie sur l'intelligence artificielle et l'analytique pour améliorer les résultats marketing tout en optimisant l'expérience client par le jeu de la personnalisation en temps réel.