Reconocimiento de Imágenes

Qué es y por qué es importante

Computer Vision es un campo de la inteligencia artificial que capacita a las computadoras para interpretar y comprender el mundo visual. Utilizando imágenes digitales de cámaras y vídeos y modelos de deep learning, las máquinas pueden identificar y clasificar objetos con precisión - y luego reaccionar ante lo que "ven."

Historia de computer vision

Los primeros experimentos de computer vision tuvieron lugar en la década de 1950 y utilizaron algunas de las primeras redes neuronales para detectar los bordes de un objeto y clasificar objetos sencillos en categorías como círculos y cuadrados. En la década de 1970, el primer uso comercial de computer vision interpretó texto mecanografiado o manuscrito mediante el reconocimiento óptico de caracteres. Este avance se utilizaba para interpretar textos escritos para ciegos.

A medida que Internet maduraba en la década de 1990, haciendo que grandes conjuntos de imágenes estuvieran disponibles en línea para su análisis, florecieron los programas de reconocimiento facial. Estos crecientes conjuntos de datos ayudaron a que las máquinas pudieran identificar a personas concretas en fotos y vídeos.

En la actualidad, una serie de factores han convergido para propiciar un renacimiento de computer vision :

La tecnología móvil con cámaras incorporadas ha saturado el mundo de fotos y vídeos.

La potencia informática se ha vuelto más asequible y fácilmente accesible.

Cada vez se dispone de más hardware diseñado para computer vision analítica de cómputo.

Los nuevos algoritmos, como las redes neuronales convolucionales, pueden aprovechar las capacidades del hardware y el software.

Los efectos de estos avances en el campo de computer vision han sido asombrosos. Los índices de precisión en la identificación y clasificación de objetos han pasado del 50% al 99% en menos de una década, y los sistemas actuales son más precisos que los humanos a la hora de detectar y reaccionar rápidamente a las entradas visuales.

Primer plano de un hombre de camisa roja sosteniendo un balón de fútbol

Una nueva era en el tratamiento del cáncer

Los métodos tradicionales de evaluación de tumores cancerosos requieren muchísimo tiempo. Basados en una cantidad limitada de datos, estos métodos pueden dar lugar a errores y son propensos a la subjetividad. En colaboración con SAS, el UMC de Ámsterdam ha transformado las evaluaciones de tumores gracias a la inteligencia artificial. Mediante el uso de tecnología de computer vision y modelos de deep learning para aumentar la velocidad y la precisión de las evaluaciones de respuesta a la quimioterapia, los médicos pueden identificar a los pacientes con cáncer candidatos a cirugía más rápidamente y con una precisión que salva vidas.

Computer vision parece un rompecabezas

Las computadoras ensamblan las imágenes visuales de la misma manera que se monta un rompecabezas.

Piense en cómo resuelve un rompecabezas. Tiene todas estas piezas y tiene que ensamblarlas en una imagen. Así funcionan las redes neuronales de computer vision. Distinguen muchas partes diferentes de la imagen, identifican los bordes y luego modelan los subcomponentes. Mediante el filtrado y una serie de acciones a través de capas de redes profundas, pueden recomponer todas las partes de la imagen, como si se tratara de un puzzle.

La computadora no recibe una imagen final en la parte superior de una caja de rompecabezas, sino cientos o miles de imágenes relacionadas para entrenarlo a reconocer objetos específicos.

En lugar de entrenar a las computadoras para que busquen bigotes, rabos y orejas puntiagudas para reconocer a un gato, los programadores cargan millones de fotos de gatos, y entonces el modelo aprende por sí solo los distintos rasgos que componen un gato.

Computer vision en el mundo actual

Desde el reconocimiento de rostros hasta el procesamiento de la acción en directo de un partido de fútbol, la visión por ordenador rivaliza y supera las capacidades visuales humanas en muchas áreas.

Deep learning y computer vision

¿Cómo entrena el deep learning a una computadora para ver? Aprenda cómo funcionan los distintos tipos de redes neuronales y cómo se utilizan para computer vision.

Descargue el documento

Análisis de imágenes e IA

Vea una introducción al análisis de imágenes y aprenda técnicas analíticas que podrá aplicar a los datos de imágenes.

Vea el webinar

Demostración de reconocimiento facial

Aprenda las técnicas subyacentes y los pasos de procesamiento de datos necesarios para el reconocimiento facial y computer vision. Esta demostración muestra cómo un modelo^SAS® ^Viya® detecta, alinea, representa y clasifica imágenes faciales.

Ver la demostración

M´ás información acerca de industrias que emplean esta tecnología

Computer vision es una de las cosas más notables que han surgido en el mundo del deep learning y la inteligencia artificial. Los avances que el deep learning ha aportado al campo de computer vision han marcado la diferencia. Wayne Thompson SAS Data Scientist

Computer vision para la conservación de animales

Aprenda cómo funciona un modelo de computer vision diseñado para analizar huellas de animales. ¿Se puede entrenar a la computadora para que vea una huella como lo haría un rastreador de animales autóctonos? Vea cómo la computadora procesa las distintas capas de información para determinar el animal y su sexo. En este vídeo, Jared Peterson, Senior Manager de SAS Advanced Analytics R&D, muestra cómo las redes neuronales son la ciencia que hay detrás de computer vision.

Descubra cómo WildTrack protege a las especies amenazadas

Ver resultados con computer vision.

Los usuarios de computer vision de muchas industrias están viendo resultados reales, y hemos documentado muchos de ellos en esta infografía. Por ejemplo, sabía que,

¿Con computer vision se puede distinguir entre daños reales y simulados?
¿computer vision le permite el reconocimiento facial para aplicaciones de seguridad?
Computer vision hace posible la caja automática en las tiendas de retail.

Desde la detección de defectos en la manufactura hasta la detección precoz de enfermedades vegetales en la agricultura, computer vision se utiliza en más ámbitos de los que podría esperar.

Haga clic en la infografía para ver los resultados de las industrias retail, bancario y salud, entre otros.

Cómo funciona computer vision

Computer vision funciona en tres pasos básicos:

Adquirir una imagen

Las imágenes, incluso grandes conjuntos, pueden adquirirse en tiempo real mediante vídeo, fotos o tecnología 3D para su análisis.

Tratamiento de la imagen

Los modelos de deep learning automatizan gran parte de este proceso, pero a menudo se entrenan alimentándolos primero con miles de imágenes etiquetadas o preidentificadas.

Comprenda la imagen

La última etapa es la interpretativa, en la que se identifica o clasifica un objeto.

Los sistemas de IA actuales pueden ir un paso más allá y emprender acciones basadas en la comprensión de la imagen. Hay muchos tipos de computer vision que se utilizan de diferentes maneras:

La segmentación de imágenes divide una imagen en varias regiones o fragmentos que se examinarán por separado.
La detección de objetos identifica un objeto específico en una imagen. La detección avanzada de objetos reconoce muchos objetos en una misma imagen: un campo de fútbol, un jugador ofensivo, un jugador defensivo, un balón, etc. Estos modelos utilizan una coordenada X,Y para crear una caja delimitadora e identificar todo lo que hay dentro de la caja.
El reconocimiento facial es un tipo avanzado de detección de objetos que no sólo reconoce un rostro humano en una imagen, sino que identifica a un individuo concreto.
La detección de bordes es una técnica utilizada para identificar el borde exterior de un objeto o paisaje para identificar mejor lo que hay en la imagen.
La detección de patrones es un proceso de reconocimiento de formas, colores y otros indicadores visuales repetidos en imágenes.
La clasificación de imágenes las agrupa en diferentes categorías.
La concordancia de características es un tipo de detección de patrones que compara similitudes en imágenes para ayudar a clasificarlas.

Las aplicaciones sencillas de computer vision pueden utilizar sólo una de estas técnicas, pero los usos más avanzados, como la visión por ordenador para coches autoconducidos, se basan en múltiples técnicas para lograr su objetivo.

Siguientes pasos

Ver para creer. Descubra lo que SAS puede ayudarle a conseguir con lcomputer vision.

Computer vision de SAS

Producto destacado para Computer Vision

SAS^® Visual Data Mining and Machine Learning

Esta solución de SAS admite clústeres, diferentes tipos de regresión, bosques aleatorios, modelos de impulso de gradiente, máquinas de vectores soporte, análisis de sentimientos y mucho más, además de deep learning. Un entorno de canalización interactivo y visual presenta cada proyecto (u objetivo) como una serie de pasos codificados por colores que se suceden en una secuencia lógica.

Pruébelo sin costo

Lecturas recomendadas

Conéctese con SAS y vea lo que podemos hacer por usted.

Obtenga una prueba sin costo

Solicite una demostración

Solicite una cotización

Contáctenos

Reconocimiento de Imágenes

Qué es y por qué es importante

Historia de computer vision