Computer Vision
Cos’è e perché è importante
La computer vision è una branca dell’ intelligenza artificiale che addestra i computer a interpretare e comprendere il mondo visivo. Utilizzando immagini digitali provenienti da fotocamere e video e modelli di deep learning , le macchine possono identificare e classificare con precisione gli oggetti e quindi reagire a ciò che "vedono".”
Storia della computer vision
I primi esperimenti di Computer vision ebbero luogo negli anni ’50, utilizzando alcune delle prime reti neurali per rilevare i bordi di un oggetto e per ordinare in categorie oggetti dalle forme elementari, come cerchi e quadrati. Negli anni ’70, il primo uso commerciale di computer vision interpretò un testo manoscritto o dattiloscritto, utilizzando il riconoscimento ottico dei caratteri. Questo progresso rese possibile l’interpretazione di un testo scritto per i non vedenti.
La progressiva diffusione di Internet a partire dagli anni ’90 ha reso disponibili per l’analisi grandi quantità di immagini online e ha favorito la messa a punto di programmi di riconoscimento facciale. In altre parole, il crescente volume di dati ha permesso lo sviluppo di macchine, in grado d’identificare specifici individui in supporti foto e video.
Oggi, la convergenza di una serie di fattori sta rinnovando l’interesse verso la computer vision:
La tecnologia mobile con fotocamere integrate ha saturato il mondo di foto e video.
La potenza di calcolo è diventata più conveniente e facilmente accessibile.
Gli hardware progettati per la computer vision e l'analisi sono maggiormente disponibili.
Nuovi algoritmi come le reti neurali convoluzionali possono sfruttare le funzionalità di hardware e software.
Gli effetti di questi progressi nel campo della computer vision sono stati sorprendenti. In meno di un decennio, i livelli di accuratezza nell’identificazione e classificazione degli oggetti sono passati dal 50 al 99%. Inoltre, gli attuali sistemi sono più precisi dell’occhio umano, nel rilevare e reagire con rapidità agli input visivi.
Una nuova era nella cura del cancro
I metodi tradizionali per la valutazione dei tumori cancerosi richiedono molto tempo. Basandosi su una quantità limitata di dati, tali metodi non sono sufficientemente oggettivi e presentano perciò un margine di errore. Con l’aiuto di SAS, la Amsterdam UMC ha trasformato il metodo di valutazione dei tumori, sfruttando l’intelligenza artificiale. I medici utilizzano la tecnologia di computer vision e i modelli di deep learning, per accelerare e approfondire l'analisi della risposta ai trattamenti chemioterapici. Ciò consente loro di identificare più velocemente i pazienti candidati all'intervento chirurgico, con una precisione salvavita.
La computer vision assomiglia a un puzzle
I computer assemblano le immagini nello stesso modo in cui si compongono le tessere di un puzzle.
Immaginiamo di avere davanti un puzzle. Per formare l’immagine, dobbiamo assemblare tutte le tessere sparse. Le reti neurali per la computer vision funzionano in base allo stesso principio. Distinguono i numerosi elementi che compongono un’immagine, identificano i bordi e poi modellano i sottocomponenti. Successivamente, usando il filtraggio e una serie di azioni attraverso gli strati profondi della rete, mettono insieme tutti gli elementi che compongono l'immagine, proprio come se si trattasse di un puzzle.
Il computer non dispone dell’immagine finale, che compare abitualmente sulla scatola del puzzle, ma è stato alimentato da centinaia, se non migliaia di immagini correlate, che lo addestrano a riconoscere oggetti specifici.
Per riconoscere un gatto, invece di addestrare i computer a cercare baffi, code e orecchie a punta, i programmatori caricano milioni di foto di gatti. In tal modo, fanno sì che il modello apprenda autonomamente a distinguere le diverse caratteristiche che compongono un gatto.
La computer vision nel mondo di oggi
Dal riconoscimento facciale all'elaborazione delle azioni di gioco durante una partita di calcio, la computer vision supera ormai le capacità dell’occhio umano in molti campi.
Deep learning e computer vision
In che modo il deep learning addestra un computer a vedere? Scopri come funzionano i diversi tipi di reti neurali e come vengono utilizzate per la computer vision.
Analisi dell'immagine e AI
Guarda la presentazione sull'analisi delle immagini e scopri le tecniche analitiche che puoi applicare ai dati di questo tipo.
Demo di riconoscimento facciale
Scopri le tecniche sottostanti e le fasi di elaborazione dei dati necessarie per il riconoscimento facciale e la computer vision. Questa demo mostra come un modello SAS® Viya® rileva, allinea, presenta e classifica le immagini facciali.
Chi utilizza la computer vision?
La computer vision è utilizzata in tutti i settori per migliorare l’esperienza del consumatore, ridurre i costi e aumentare la sicurezza.
- Seleziona un settore
- Commercio al dettaglio
- Manifatturiero
- Settore Pubblico
- Assistenza sanitaria
- Difesa e sicurezza
- Assicurazioni
Commercio al dettaglio
I rivenditori possono utilizzare la computer vision per migliorare l'esperienza di acquisto, prevenire le perdite e rilevare problemi di fuori stock. La computer vision offre già un grosso supporto ai clienti velocizzandone i pagamenti attraverso l’impiego di casse automatiche, o combinandosi con il machine learning per snellire del tutto le operazioni di cassa.
Manifatturiero
Nella settore manifatturiero, le aziende utilizzano la computer vision per identificare i difetti dei prodotti in tempo reale. Non appena i prodotti escono dalla linea di produzione, un computer elabora le immagini o i video e segnala decine di diverse tipologie di difetti, anche sul più piccolo dei prodotti.
Settore Pubblico
Gli enti della Pubblica Amministrazione utilizzano la computer vision per avere una visione chiara delle condizioni fisiche degli assets che ricadono sotto il loro controllo, incluse le apparecchiature e le infrastrutture. Analizzando le immagini tramite la computer vision, possono eseguire la manutenzione predittiva e decidere dove e quando effettuare un ripristino. Inoltre, la computer vision viene sfruttata anche per il monitoraggio della conformità a policy e regolamenti. Ad esempio, per rilevare il contrabbando di merci, segnalare potenziali violazioni della sicurezza negli edifici, controllare le etichette nel rispetto delle linee guida e delle normative sulla conservazione. Infine, con il crescente impiego dei droni per scopi difesivi e di sicurezza interna, l'uso degli analytics per rilevare e esaminare elementi critici provenienti dal feed visivo farà della computer vision uno strumento indispensabile nel settore pubblico.
Assistenza sanitaria
In campo medico, i sistemi di computer vision esaminano meticolosamente le immagini di risonanze magnetiche, TAC e raggi X per rilevare anomalie con la stessa precisione dell’occhio di un medico. Inoltre, gli operatori sanitari utilizzano le reti neurali su immagini tridimensionali come gli ultrasuoni, per rilevare differenze visive nella frequenza cardiaca e altro ancora.
Difesa e sicurezza
In ambienti ad alta sicurezza, come banche e casinò, la computer vision è utilizzata per garantire l’identificazione dei clienti quando vengano scambiate grosse somme di denaro. Gli addetti alla sicurezza non sono in grado di analizzare all’istante centinaia di feed video, a differenza di un algoritmo di computer vision.
Assicurazioni
Nel settore assicurativo, le compagnie utilizzano la computer vision per valutare in maniera più congrua e accurata i danni al veicolo, contribuendo a ridurre le frodi e a semplificare la gestione dei reclami.
La computer vision è uno delle funzionalità più straordinarie emerse dal mondo del deep learning e dell’intelligenza artificiale (IA). I progressi a cui il deep learning ha contribuito nel campo nella computer vision sono stati davvero unici. Wayne Thompson SAS Data Scientist
La computer vision nella conservazione delle specie animali
Scopri come funziona un modello di computer vision progettato per analizzare le tracce di animali. Un computer può essere addestrato a vedere un’orma come farebbe un tracker di animali indigeno? Scopri come il computer elabora i diversi livelli di informazioni per individuare l'animale e il suo sesso. In questo video, Jared Peterson, Senior R&D Manager in Advanced Analytics presso SAS, spiega come le reti neurali siano la scienza alla base della computer vision.
Risultati conseguiti con la computer vision
Le applicazioni della computer vision stanno portando a risultati concreti in molti settori, come illustrato in questa infografica. Ad esempio, sapevi che:
- La computer vision può distinguere tra danni fittizi e reali, nel caso di incidenti in cui siano coinvolti autovetture?
- La computer vision consente il riconoscimento facciale nelle applicazioni per la sicurezza?
- La computer vision rende possibile il pagamento automatico nei moderni negozi al dettaglio?
Dall'individuazione di difetti di produzione al rilevamento dei primi segni di malattie delle piante in agricoltura, la computer vision viene utilizzata in molte più aree di quelle che ci si potrebbe attendere.
Clicca sull’infografica per vedere i risultati nel settore del commercio al dettaglio, delle banche, dell’assistenza sanitaria e altro ancora.
Come funziona la computer vision
La computer vision funziona in tre passaggi fondamentali:
Acquisizione dell’immagine
Le immagini, anche di grandi dimensioni, possono essere acquisite in tempo reale tramite video, foto o tecnologia 3D, per finalità di analisi.
Elaborazione dell'immagine
I modelli di deep learning automatizzano gran parte di questo processo, dopo essere stati addestrati tramite il caricamento di migliaia di immagini etichettate o pre-identificate.
Interpretazione dell'immagine
La fase finale è l’interpretazione, che consiste nell’identificazione o classificazione dell’immagine.
Gli attuali sistemi di AI sono in grado di fare un ulteriore passo in avanti e intraprendere azioni basate sulla comprensione dell’immagine. La computer vision è disponibile in molte forme, utilizzabili in diversi modi:
- La segmentazione dell’immagine suddivide un’immagine in molteplici regioni o parti, che vengono esaminate separatamente.
- Il rilevamento di oggetti identifica un oggetto specifico presente in un’immagine. Il rilevamento avanzato di oggetti riconosce molteplici oggetti all’interno di un'unica immagine: un campo di calcio, un attaccante, un difensore, un pallone e così via. Questi modelli utilizzano un sistema di coordinate X, Y per creare una bounding box, o riquadro, e identificare tutti gli oggetti che ricadono al suo interno.
- Il riconoscimento facciale è un’evoluzione del rilevamento di oggetti che consente non solo di riconoscere il volto umano in un’immagine, ma anche di identificare un individuo specifico.
- Il rilevamento dei bordi è una tecnica utilizzata per identificare il bordo esterno di un oggetto o le linee di un paesaggio, allo scopo di comprendere esattamente quali elementi siano presenti all’interno dell'immagine.
- Il rilevamento dei pattern è il processo di riconoscimento di forme, colori e altri indicatori visivi che ricorrono nelle immagini.
- La classificazione delle immagini raggruppa le immagini in diverse categorie.
- La corrispondenza delle caratteristiche è un tipo di rilevamento del modello che individua le somiglianze presenti in una serie di immagini, per facilitarne la classificazione.
Le applicazioni più semplici della computer vision possono utilizzare solo una di queste tecniche, mentre quelle più avanzate, come la computer vision per le auto a guida autonoma, si basano su un insieme di tecniche per portare a termine il proprio obiettivo.
Passi successivi
Vedere per credere. Scopri cosa puoi realizzare con il supporto della computer vision di SAS.
Prodotto in primo piano per la computer vision
SAS® Visual Data Mining e Machine Learning
Oltre al deep learning, la soluzione di SAS supporta il clustering, diversi tipi di regressione, le foreste casuali, modelli di aumento del gradiente, macchine a vettori di supporto, l’analisi del sentiment e altro ancora. Un ambiente di pipeline interattivo e visivo presenta ogni progetto (o obiettivo) come una serie di passaggi con codici colore, che si verificano secondo una sequenza logica.
Letture consigliate
- ARTICOLO As AI accelerates, focus on 'road' conditionsAI technology has made huge strides in a short amount of time and is ready for broader adoption. But as organizations accelerate their AI efforts, they need to take extra care, because as any police officer will tell you, even small potholes can cause problems for vehicles traveling at high speeds.
- ARTICOLO From Apollo to AI: A new era of American explorationAs we celebrate the 50th anniversary of the Apollo 11 mission, what’s the next frontier for American Innovation? It’s available now, from our desks and waits for us to unlock its potential.
- ARTICOLO Formazione e Lavoro: cosa studiare e come prepararsi al futuro?Quali saranno le nuove opportunità che si creeranno e quali competenze richieste? Cosa significa davvero "esperto" di intelligenza artificiale e che tipo di lavoro dovrà svolgere? Scoprilo leggendo questo articolo...