Reconocimiento de imágenes
Qué es y por qué es importante
El reconocimiento de imágenes es un campo de la inteligencia artificial que entrena a los ordenadores para interpretar y entender el mundo visual. Con el uso de imágenes digitales de cámaras y vídeos y de modelos de aprendizaje profundo, las máquinas pueden identificar de forma precisa, así como clasificar objetos y después reaccionar ante lo que «ven».
Historia del reconocimiento de imágenes
Los primeros experimentos de reconocimiento de imágenes tuvieron lugar en la década de 1950, con el uso de algunas de las primeras redes neuronales tcon el fin de detectar los bordes de un objeto y de clasificar objetos sencillos en categorías, como círculos y cuadrados. En la década de 1970, el primer uso comercial del reconocimiento de imágenes interpretó texto mecanografiado o escrito a mano mediante el reconocimiento óptico de caracteres.
AA medida que Internet fue madurando en la década de 1990 y permitiendo la disponibilidad de grandes cantidades de imágenes en línea para su análisis, los programas de reconocimiento facial prosperaron. Estos conjuntos crecientes de datos contribuyeron a que las máquinas pudieran identificar a personas concretas en fotografías y vídeos.
En la actualidad, una serie de factores han convergido para provocar un renacimiento en el reconocimiento de imágenes:
La tecnología móvil con cámaras incorporadas ha saturado el mundo de fotos y vídeos.
La potencia informática ha pasado a ser más asequible y fácilmente accesible.
El hardware diseñado para el reconocimiento de imágenes y para el análisis tiene una disponibilidad más amplia.
Nuevos algoritmos, como las redes neuronales convolucionales, pueden sacar partido de las capacidades del hardware y el software.
Los efectos de estos avances en el campo del reconocimiento de imágenes han sido asombrosos. Los índices de precisión en la identificación y clasificación de objetos han pasado del 50 al 99 % en menos de una década, y los sistemas actuales son más precisos que los humanos en la rápida detección y reacción ante entradas visuales.
Una nueva era del tratamiento del cáncert
Los métodos tradicionales para la evaluación de tumores cancerosos son increíblemente lentos. Basados en una cantidad limitada de datos, tales métodos pueden conducir a errores y son propensos a la subjetividad. Trabajando con SAS, el centro médico Ámsterdam UMC ha transformado las evaluaciones de tumores a través de la inteligencia artificial. Al utilizar tecnología de reconocimiento de imágenes y modelos de aprendizaje profundo para aumentar la velocidad y la precisión de las evaluaciones de respuesta a la quimioterapia, los médicos pueden identificar más rápido a los pacientes de cáncer que son candidatos a la cirugía, y con una precisión capaz de salvar vidas.
El reconocimiento de imágenes es similar a un puzzle
Los ordenadores reúnen imágenes visuales de la misma forma en la que se puede encajar un puzzle.
Piensa en cómo se forma un puzle. Necesitas juntar todas esas piezas para crear una imagen. Así funcionan las redes neuronales para el reconocimiento de imágenes. Distinguen muchas partes diferentes de la imagen, identifican los bordes y seguidamente moldean los subcomponentes. Mediante el filtrado y una serie de acciones a través de las capas de la red profunda, pueden juntar todas las piezas de una imagen, prácticamente de la misma forma en la que harías un puzlze.
TEl ordenador no cuenta con una imagen final de referencia en la caja del puzle, sino que suele disponer de cientos o miles de imágenes relacionadas para entrenarse en el reconocimiento de objetos concretos.
En lugar de entrenar a los ordenadores para que busquen bigotes, colas y orejas puntiagudas para reconocer a un gato, los programadores suben millones de fotografías de gatos, y a continuación el modelo aprende por su cuenta las diferentes características que componen un gato.
Reconocimiento de imágenes en el mundo actual
Desde el reconocimiento facial hasta el procesamiento de la acción en directo de un partido de fútbol, el reconocimiento de imágenes compite y supera la capacidad visual humana en muchos aspectos.
Aprendizaje profundo y reconocimiento de imágenes
¿Cómo entrena el aprendizaje profundo a un ordenador para que este vea? Obtén más información acerca del funcionamiento de los diferentes tipos de redes neuronales y de cómo se utilizan para el reconocimiento de imágenes.
Análisis de imagen e IA
Ve una introducción al análisis de imágenes y aprende técnicas analíticas que puedes aplicar a los datos de las imágenes.
Demostración de reconocimiento facial
Aprende cuáles son las técnicas subyacentes y los pasos de procesamiento de datos necesarios para el reconocimiento facial y para el reconocimiento de imágenes. Esta demostración muestra la forma en la que un modelo SAS® Viya® detecta, nivela, representa y clasifica imágenes faciales.
¿Quién usa el reconocimiento de imágenes?
El reconocimiento de imágenes se utiliza en todos los sectores para mejorar la experiencia del usuario, reducir costes y aumentar la seguridad.
Minorista
Retailers can use computer vision to enhance the shopping experience, increase loss prevention and detect out-of-stock shelves. Computer vision is already helping customers checkout more quickly – aiding using self-checkout machines or combining with machine learning to alleviate the checkout process completely.
Fabricación
In manufacturing, businesses use computer vision to identify product defects in real time. As the products are coming off the production line, a computer processes images or videos, and flags dozens of different types of defects — even on the smallest of products.
Gobierno
Public Sector agencies use computer vision to better understand the physical condition of assets under their control, including equipment and infrastructure. Computer vision can help agencies perform predictive maintenance by analyzing equipment and infrastructure images to make better decisions on which of these require maintenance. In addition, Public Sector agencies use computer vision to help monitor compliance with policies and regulations. For example, computer vision can be used to detect contraband in cargo, flag potential safety violations in buildings, review labels for adherence to guidelines, and ensure compliance with conservation regulations. Finally, as drones become used more defense and homeland security needs, the use of analytics to identify and analyze critical elements from the visual feed will rise to the forefront of computer vision use cases in the public sector.
Salud
In the medical field, computer vision systems thoroughly examine imagery from MRIs, CAT scans and X-rays to detect abnormalities as accurately as human doctors. Medical professionals also use neural networks on three-dimensional images like ultrasounds to detect visual differences in heartbeats and more.
Defensa y seguridad
In high-security environments like banking and casinos, businesses use computer vision for more accurate identification of customers when large amounts of money are being exchanged. It’s impossible for security guards to analyze hundreds of video feeds at once, but a computer vision algorithm can.
Seguros
In the insurance industry, companies use computer vision to conduct more consistent and accurate vehicle damage assessments. The advancement is reducing fraud and streamlining the claims process.
El reconocimiento de imágenes es una de las cosas más significativas que han surgido del mundo del aprendizaje profundo y de la inteligencia artificial. Los avances que el aprendizaje profundo ha aportado al campo del reconocimiento de imágenes lo han diferenciado verdaderamente del resto. Wayne Thompson Científico de datos SAS
Reconocimiento de imágenes para la conservación de los animales
Obtén información acerca de cómo funciona un modelo de reconocimiento de imágenes diseñado para el análisis de huellas animales. ¿Se le puede entrenar a un ordenador para que vea una huella de la misma forma en la que lo haría un rastreador de animales autóctonos? Obtén información acerca cómo el ordenador procesa las diferentes capas de información para determinar el animal y su sexo. En este vídeo, Jared Peterson, director general de I+D de Analítica avanzada de SAS, muestra cómo las redes neuronales son la ciencia que radica detrás del reconocimiento de imágenes.
Ver resultados con reconocimiento de imágenes
Los usuarios del reconocimiento de imágenes de numerosos sectores están viendo resultados reales, y hemos documentado muchos de ellos en este infográfico. Por ejemplo, ¿sabías que…
- el reconocimiento de imágenes puede distinguir entre los daños en el coche reales y los escenificados?
- ¿El reconocimiento de imágenes permite el reconocimiento facial para su aplicación en entornos de seguridad?
- ¿El reconocimiento de imágenes permite el pago automático en las tiendas minoristas más modernas?
Desde la detección de defectos en la industria de la manufactura hasta la detección de signos tempranos de enfermedades de las plantas en el campo de la agricultura, el reconocimiento de imágenes se utiliza en más áreas de las que te puedas imaginar.
Haz clic en este infográfico para consultar los resultados en la industria minorista, bancaria, sanitaria y muchas más.
Cómo funciona el reconocimiento de imágenes
El reconocimiento de imágenes funciona en tres pasos básicos:
Adquisición de una imagen
Las imágenes, incluso en grandes conjuntos, se pueden adquirir en tiempo real a través de vídeo, fotografías o tecnología 3D para su análisis.
Procesamiento de la imagen
Los modelos de aprendizaje profundo automatizan gran parte de este proceso, pero los modelos suelen entrenarse alimentado primero miles de imágenes etiquetadas o identificadas previamente.
Entendimiento de la imagen
El último paso es el interpretativo, en el que se identifica o clasifica un objeto.
Los sistemas actuales de IA pueden ir un paso más allá y realizar acciones basadas en un entendimiento de la imagen. Existen muchos tipos de reconocimiento de imágenes que se utilizan de diferentes formas:
- La segmentación de la imagen divide una imagen en múltiples regiones o fragmentos que se examinan por separado.
- La detección de objetos identifica un objeto específico en una imagen. La detección de objetos avanzada reconoce muchos objetos en una única imagen: un campo de fútbol, un jugador ofensivo, un jugador de defensa, un balón y así sucesivamente. Estos modelos hacen uso de una coordenada X, Y para crear una caja delimitadora e identificar todos los componentes de la caja.
- El reconocimiento facial es un tipo avanzado de detección de objetos que no solo reconoce un rostro humano en una imagen, sino que identifica a una persona en concreto.
- La detección de bordes es una técnica utilizada para identificar el borde exterior de un objeto o paisaje para la mejor identificación del contenido de la imagen.
- La detección de patrones es un proceso de reconocimiento de formas, colores y otros indicadores visuales en imágenes que se repiten.
- La clasificación de imágenes agrupa imágenes en diferentes categorías.
- La coincidencia de rasgos es un tipo de detección de patrones que hace coincidir similitudes en imágenes para contribuir a su clasificación.
Las aplicaciones sencillas de reconocimiento de imágenes pueden utilizar únicamente una de estas técnicas, pero usos más avanzados, como el reconocimiento de imágenes de coches autopropulsados, se basan en múltiples técnicas para lograr su objetivo.
Siguientes pasoss
Ver es creer. Descubre en lo que SAS puede ayudarte a lograr con el reconocimiento de imágenes.
Producto destacado para el reconocimiento de imágenes
SAS® Minería de datos visual y aprendizaje automático
Esta solución SAS es compatible con la agrupación, diferentes tipos de regresión, bosques aleatorios, modelos de refuerzo de gradiente, máquinas de vectores de soporte, análisis de opiniones y mucho más, además de aprendizaje profundo. Un entorno interactivo y visual presenta cada proyecto (u objetivo) como una serie de pasos codificados por colores que se producen en una secuencia lógica.
Lecturas recomendadas
- Página de información Break stuff . . . servers, rules and the glass ceilingCarla Gentry knows what it’s like to be the only woman on the team and is happy to share her hard-won knowledge with an ever-growing number of female data scientists. She recently shared with us some sage advice for women entering or interested in advancing in the field.
- Artículo The untapped potential in unstructured textText is the largest human-generated data source. It grows every day as we post on social media, interact with chatbots and digital assistants, send emails, conduct business online, generate reports and essentially document our daily thoughts and activities using computers and mobile devices.
- Artículo How to improve your AI marketing skillsMarketing teams can use current AI capabilities to enhance their efforts around campaign automation, dynamic pricing based on forecasting models, and by providing more relevant, real-time customer offers.