Computer vision
Wat is het en waarom is het belangrijk
Computer vision is een gebied binnen de kunstmatige intelligentie dat computers traint om de visuele wereld te interpreteren en te begrijpen. Met behulp van digitale camera- en videobeelden en deep learning-modellen kunnen machines objecten nauwkeurig identificeren en classificeren. Vervolgens reageren ze op wat ze 'zien'.
Geschiedenis van computer vision
De eerste experimenten met computer vision vonden plaats in de jaren 1950, waarbij enkele van de eerste neurale netwerken werden gebruikt om de randen van een object te detecteren en eenvoudige objecten te sorteren in categorieën zoals cirkels en vierkanten. In de jaren 1970 werd computer vision voor het eerst commercieel gebruikt om getypte of handgeschreven tekst te interpreteren met behulp van optische tekenherkenning. Deze vooruitgang werd gebruikt om geschreven tekst te interpreteren voor blinden.
Met het steeds volwassener worden van het internet rond 1990 werden grote sets afbeeldingen online beschikbaar voor analyse, wat leidde tot de opkomst van gezichtsherkenningsprogramma's. Dankzij deze groeiende datasets konden machines specifieke mensen op foto's en video's identificeren.
En nu zijn een aantal factoren samen verantwoordelijk voor een renaissance van computer vision:
Mobiele technologie met ingebouwde camera's heeft de wereld overstelpt met foto's en video's.
Computerkracht is betaalbaarder en gemakkelijker toegankelijk geworden.
Hardware ontworpen voor computer vision en analyse is op grotere schaal beschikbaar.
Nieuwe algoritmes zoals convolutionele neurale netwerken, kunnen profiteren van de hardware- en softwaremogelijkheden.
De effecten van deze vooruitgang op het gebied van computer vision zijn ongekend. De nauwkeurigheid van objectidentificatie en -classificatie is in minder dan tien jaar gestegen van 50 naar 99 procent, en de hedendaagse systemen zijn nauwkeuriger dan mensen in het snel detecteren van, en reageren op visuele input.
Een nieuw tijdperk voor de behandeling van kanker
Traditionele methoden om kankertumoren te evalueren zijn ongelooflijk tijdrovend. Ze baseren zich op een beperkte hoeveelheid gegevens en kunnen tot fouten leiden. Daarnaast zijn ze vatbaar voor subjectiviteit. In samenwerking met SAS heeft het Amsterdam UMC tumorevaluaties getransformeerd door middel van kunstmatige intelligentie. Computer vision-technologie en deep learning-modellen leiden tot een snellere en nauwkeurigere beoordeling van hoe patiënten op chemotherapie reageren. Hierdoor kunnen artsen kankerpatiënten die in aanmerking komen voor een operatie sneller en met levensreddende precisie identificeren.
Computer vision is als een legpuzzel
Computers zetten visuele beelden in elkaar op dezelfde manier als je een legpuzzel in elkaar zet.
Hoe ga je aan de slag met een legpuzzel? Je hebt alle stukjes en moet ze samenvoegen tot een afbeelding. Dat is precies wat neurale netwerken doen voor computer vision. Ze onderscheiden veel verschillende stukjes van de afbeelding, ze identificeren de randen en modelleren vervolgens de subcomponenten. Door gebruik te maken van filtering en een reeks handelingen via diepe netwerklagen, kunnen ze alle delen van de afbeelding samenvoegen, net zoals je dat met een puzzel zou doen.
De computer krijgt niet een definitieve afbeelding zoals op de bovenkant van een puzzeldoos, maar wel honderden of duizenden gerelateerde afbeeldingen om hem te trainen in het herkennen van specifieke objecten.
In plaats van computers te trainen om te zoeken naar snorharen, staarten en puntige oren om een kat te herkennen, uploaden programmeurs miljoenen foto's van katten en dan leert het model zelf de verschillende kenmerken van een kat.
Computer vision in de wereld van vandaag
Van het herkennen van gezichten tot het verwerken van de live actie van een voetbalwedstrijd, computer vision evenaart en overtreft menselijke visuele vaardigheden op veel gebieden.
Deep learning en computer vision
Hoe traint deep learning een computer om te zien? Lees hoe de verschillende soorten neurale netwerken werken en hoe ze worden gebruikt voor computer vision.
Beeldanalyse en AI
Bekijk een inleiding in beeldanalyse (image analysis) en leer analytische technieken die je kunt toepassen op beeldgegevens.
Demo over gezichtsherkenning
Welke onderliggende technieken en gegevensverwerkingsstappen zijn nodig voor gezichtsherkenning en computer vision? Deze demo laat zien hoe een SAS® Viya®-model gezichtsbeelden detecteert, uitlijnt, representeert en classificeert.
Wie gebruikt computer vision?
Computer vision wordt gebruikt in verschillende industrieën om de klantervaring te verbeteren, kosten te verminderen en veiligheid te verhogen.
- Selecteer een industrie
- Retail
- Manufacturing
- Overheid
- Gezondheidszorg
- Defensie en veiligheid
- Verzekeringen
Retail
Detailhandelaars kunnen computer vision gebruiken om de winkelervaring te verbeteren, verliezen te voorkomen en lege schappen te detecteren. Dankzij computer vision kunnen klanten nu al sneller afrekenen, of het nu is via zelfbedieningskiosken of in combinatie met machine learning om het afrekenproces volledig te vereenvoudigen.
Manufacturing
In de productie gebruiken bedrijven computer vision om productdefecten in realtime te identificeren. Terwijl de producten van de productielijn komen, verwerkt een computer beelden of video's en markeert tientallen verschillende soorten defecten, zelfs op de kleinste producten.
Overheid
Overheidsinstanties gebruiken computer vision om beter inzicht te krijgen in de fysieke staat van activa onder hun beheer, waaronder apparatuur en infrastructuur. Computer vision kan instanties helpen om voorspellend onderhoud uit te voeren door beelden van apparatuur en infrastructuur te analyseren en zo betere beslissingen te nemen over welke daarvan onderhoud nodig hebben. Bovendien gebruiken overheidsinstanties computer vision om de naleving van beleidsregels en voorschriften te controleren. Bijvoorbeeld, computer vision kan worden gebruikt om smokkelwaar in vracht te detecteren, potentiële veiligheidsovertredingen in gebouwen te signaleren, labels te controleren op naleving van richtlijnen, en naleving van natuurbehoudsvoorschriften te garanderen. Ten slotte zal, naarmate drones meer gebruikt worden voor defensie en binnenlandse veiligheidsbehoeften, het gebruik van analyses om kritieke elementen uit de visuele invoer te identificeren en te analyseren, een leidende rol spelen in computer vision use cases in de publieke sector.
Gezondheidszorg
Op medisch gebied onderzoeken computer vision-systemen beelden van MRI's, CAT-scans en röntgenfoto's grondig om afwijkingen net zo nauwkeurig op te sporen als menselijke artsen. Daarnaast gebruiken medische professionals neurale netwerken op driedimensionale beelden zoals echo's om, onder meer, visuele verschillen in hartslagen te detecteren.
Defensie en veiligheid
In hoogbeveiligde omgevingen, zoals banken en casino's, gebruiken bedrijven computer vision voor nauwkeurigere identificatie van klanten wanneer er grote geldbedragen worden uitgewisseld. Het is voor beveiligers onmogelijk om honderden videofeeds tegelijk te analyseren, maar een computer vision-algoritme kan dat wel.
Verzekeringen
In de verzekeringsbranche gebruiken bedrijven computer vision om de schade aan voertuigen consistenter en nauwkeuriger vast te stellen. Deze vooruitgang vermindert fraude en stroomlijnt het claimproces.
Computer vision is een van de meest opmerkelijke zaken die zijn voortgekomen uit de wereld van deep learning en kunstmatige intelligentie. De vooruitgang die deep learning heeft gebracht in computer vision heeft dit vakgebied werkelijk opmerkelijk gemaakt. Wayne Thompson SAS Data Scientist
Computer vision voor dierenbescherming
Leer hoe een computer vision-model werkt dat is ontworpen om diersporen te analyseren. Kan de computer worden getraind om een voetafdruk te zien zoals een inheemse dierentracker dat zou doen? Kijk hoe de computer de verschillende informatielagen verwerkt om het dier en zelfs het geslacht te bepalen. In deze video laat Jared Peterson, Senior Manager van SAS Advanced Analytics R&D, zien hoe neurale netwerken de wetenschap vormen achter computer vision.
Resultaten behalen met computer vision
In veel industrieën zien gebruikers van computer vision echte resultaten, en we hebben er veel gedocumenteerd in deze infographic. Wist je bijvoorbeeld:
- dat computer vision onderscheid kan maken tussen geënsceneerde en echte autoschade?
- dat computer vision gezichtsherkenning mogelijk maakt voor beveiligingstoepassingen?
- dat computer vision automatisch afrekenen mogelijk maakt in moderne winkels?
Computer vision vindt toepassing in meer gebieden dan je zou verwachten. Zo wordt het bijvoorbeeld ingezet voor het opsporen van defecten in de productie en het detecteren van vroege tekenen van plantenziekten in de landbouw.
Klik op deze infographic om resultaten in de detailhandel, de banksector, gezondheidszorg en meer te bekijken.
Hoe computer vision werkt
Computer vision doorloopt drie fundamentele stappen:
De afbeelding verkrijgen
Beelden, zelfs grote sets, kunnen in real-time worden verkregen via video, foto's of 3D-technologie voor analyse.
De afbeelding verwerken
Deep learning-modellen automatiseren veel van dit proces, maar de modellen worden vaak getraind door vooraf duizenden gelabelde of vooraf geïdentificeerde afbeeldingen te verwerken.
De afbeelding begrijpen
De laatste stap is de interpretatie, waarbij een object wordt geïdentificeerd of geclassificeerd.
De huidige AI-systemen kunnen nog een stap verder gaan en acties ondernemen op basis van inzicht in het beeld. Er zijn veel soorten computer vision die op verschillende manieren worden gebruikt:
- Beeldsegmentatie verdeelt een afbeelding in meerdere regio's of stukken die afzonderlijk kunnen worden onderzocht.
- Objectdetectie identificeert een specifiek object in een afbeelding. Geavanceerde objectdetectie herkent veel objecten in één beeld: een voetbalveld, een aanvaller, een verdediger, een bal enzovoort. Deze modellen gebruiken een X,Y-coördinaat om een kader te maken en alles binnen dat kader te identificeren.
- Gezichtsherkenning is een geavanceerd soort objectdetectie dat niet alleen een menselijk gezicht in een afbeelding herkent, maar ook een specifiek individu identificeert.
- Randdetectie is een techniek die wordt gebruikt om de buitenste rand van een object of landschap te identificeren, zodat beter kan worden vastgesteld wat zich in de afbeelding bevindt.
- Patroonherkenning is een proces waarbij herhaalde vormen, kleuren en andere visuele indicatoren in afbeeldingen worden herkend.
- Beeldclassificatie groepeert afbeeldingen in verschillende categorieën.
- Feature matching is een soort patroondetectie waarbij overeenkomsten in afbeeldingen worden vergeleken om ze te helpen classificeren.
Eenvoudige toepassingen van computer vision gebruiken soms maar één van deze technieken, maar geavanceerdere toepassingen, zoals computer vision voor zelfrijdende auto's, vertrouwen op meerdere technieken om hun doel te bereiken.
Vervolgstappen
Zien is geloven. Ontdek wat je samen met SAS kunt bereiken met computer vision.
Uitgelicht product voor computer vision
SAS® Visual Data Mining and Machine Learning
Deze SAS-oplossing ondersteunt behalve deep learning ook nog clustering, verschillende soorten regressie, random forests, gradient boosting-modellen, support vector-machines, sentimentanalyse en meer. Een interactieve, visuele pijplijnomgeving presenteert elk project (of doel) als een reeks kleurgecodeerde stappen die in een logische volgorde worden uitgevoerd.
Aanbevolen literatuur
- Article What is synthetic data? And how can you use it to fuel AI breakthroughs?There's no shortage of data in today's world, but it can be difficult, slow and costly to access sufficient high-quality data that’s suitable for training AI models. Learn why synthetic data is so vital for data-hungry AI initiatives, how businesses can use it to unlock growth, and how it can help address ethical challenges.
- Article Three steps for conquering the last mile of analyticsPutting your analytical models into production can be the most difficult part of the analytics journey. It’s no surprise that this last mile of analytics – bringing models into deployment – is the hardest part of digital transformation initiatives for organizations to master, yet it’s the most crucial.
- Article A guide to machine learning algorithms and their applicationsDo you know the difference between supervised and unsupervised learning? How about the difference between decision trees and forests? Or when to use a support vector algorithm? Get all the answers here.