Datamatsyn
Hvad det er, og hvorfor det er vigtigt
Datamatsyn er et område inden for kunstig intelligens, som træner computere i at fortolke og forstå den visuelle verden. Ved hjælp af digitale billeder fra kameraer og videoer og deep learning-modeller kan maskiner identificere og klassificere objekter nøjagtigt - og derefter reagere på det, de "ser".
Historien om datamatsyn
De første eksperimenter med datamatsyn fandt sted i 1950'erne, hvor man brugte nogle af de første neurale netværk til at registrere kanterne på et objekt og til at sortere simple objekter i kategorier som cirkler og firkanter. I 1970'erne fortolkede den første kommercielle brug af datamatsyn maskinskrevet eller håndskrevet tekst ved hjælp af optisk tegngenkendelse. Dette fremskridt blev brugt til at tolke skrevet tekst for blinde.
Da internettet modnedes i 1990'erne og gjorde store sæt billeder tilgængelige online til analyse, blomstrede ansigtsgenkendelsesprogrammer. Disse voksende datasæt var med til at gøre det muligt for maskiner at identificere bestemte personer på fotos og videoer.
I dag er der en række faktorer, som tilsammen har skabt en renæssance for datamatsyn:
Mobilteknologi med indbyggede kameraer har mættet verden med fotos og videoer.
Computerkraft er blevet mere overkommelig og let tilgængelig.
Hardware designet til computersyn og -analyse er mere almindeligt tilgængeligt.
Nye algoritmer som konvolutionsneurale netværk kan drage fordel af hardware- og softwarefunktionerne.
Effekten af disse fremskridt inden for datamatsyn har været slående. Nøjagtigheden af objektidentifikation og -klassifikation er gået fra 50 procent til 99 procent på mindre end et årti - og nutidens systemer er mere nøjagtige end mennesker til hurtigt at opdage og reagere på visuelle input.
Hør, hvorfor Georgia-Pacific valgte SAS
Datamatsyn minder om et puslespil
Computere samler visuelle billeder på samme måde, som man samler et puslespil.
Tænk på, hvordan du griber et puslespil an. Du har en masse brikker, og du skal samle dem til et billede. Det er sådan, neurale netværk til datamatsyn fungerer. De skelner mellem mange forskellige dele af billedet, de identificerer kanterne og modellerer derefter delkomponenterne. Ved hjælp af filtrering og en række handlinger i dybe netværkslag kan de sætte alle billedets dele sammen, ligesom man ville gøre med et puslespil.
Computeren får ikke adgang til det endelige billede som på toppen af en puslespilskasse - men bliver ofte fodret med hundredvis eller tusindvis af relaterede billeder for at træne den til at genkende specifikke objekter.
I stedet for at træne computere til at lede efter knurhår, haler og spidse ører for at genkende en kat, uploader programmørerne millioner af billeder af katte, og så lærer modellen selv de forskellige træk, der udgør en kat.
Datamatsyn i dag
Fra genkendelse af ansigter til bearbejdning af live-action i en fodboldkamp - datamatsyn konkurrerer med og overgår menneskets visuelle evner på mange områder.
Deep learning og datamatsyn
Hvordan træner deep learning en computer til at se? Få en introduktion til deep learning-teknikker og -applikationer, og lær, hvordan forskellige typer af dybe neurale netværksmodeller bruges til datamatsyn.
Et ekstra sæt øjne med datamatsyn
Georgia-Pacific integrerede datamatsyn i den daglige produktion for at indsamle og analysere billeddata. Ved konstant at overvåge for uregelmæssigheder hjælper teknologien med at løse problemer med kvalitet og sikkerhed og øger effektiviteten.
The Batting Lab
Batting Lab kombinerer AI, computersyn og IoT-analyse med baseball for at hjælpe børn med at forbedre deres slag og deres datakompetencer. Sensorer og kameraer bruger objektdetektering til at indsamle datapunkter og bearbejde optagelser og skabe anbefalinger i realtid til spillerne.
Hvem anvender datamatsyn?
Datamatsyn bruges på tværs af brancher til at øge forbrugeroplevelsen, reducere omkostningerne og øge sikkerheden.
Detail
Detailhandlere kan bruge datamatsyn til at forbedre indkøbsoplevelsen, øge forebyggelsen af tab og opdage udsolgte hylder. Datamatsyn hjælper allerede kunderne med at komme hurtigere til kassen - ved hjælp af selvbetjeningsautomater eller i kombination med maskinlæring for at lette hele processen ved kassen.
Produktion
I produktionen bruger virksomheder datamatsyn til at identificere produktfejl i realtid. Efterhånden som produkterne kommer ud af produktionslinjen, bearbejder en computer billeder eller videoer og markerer dusinvis af forskellige typer fejl - selv på de mindste produkter.
Det offentlige
Offentlige myndigheder bruger datamatsyn til bedre at forstå i hvilken fysisk tilstand de aktiver, de kontrollerer, er, herunder udstyr og infrastruktur. Datamatsyn kan hjælpe organisationer med at udføre forebyggende vedligeholdelse ved at analysere billeder af udstyr og infrastruktur for at træffe bedre beslutninger om, hvilke af disse der kræver vedligeholdelse. Desuden bruger den offentlige sektor datamatsyn til at hjælpe med at overvåge at retningslinjer og regler overholdes. Datamatsyn kan f.eks. bruges til at opdage smuglergods i fragten, markere potentielle sikkerhedsovertrædelser i bygninger, gennemgå etiketter for overholdelse af retningslinjer og sikre overholdelse af fredningsbestemmelser. Endelig vil brugen af analyser til at identificere og analysere kritiske elementer fra det visuelle feed, efterhånden som droner bliver brugt mere til forsvar og indenlandsk sikkerhed, komme til at stå i forgrunden for brug af computersyn i den offentlige sektor.
Sundhedspleje
På det medicinske område undersøger systemer til datamatsyn grundigt billeder fra MR-scanninger, CAT-scanninger og røntgenbilleder for at lokalisere abnormiteter lige så præcist som menneskelige læger. Medicinske fagfolk bruger også neurale netværk på tredimensionelle billeder som ultralyd for at opdage visuelle forskelle i hjerteslag og meget mere.
Forsikring
I forsikringsbranchen bruger virksomheder datamatsyn til at foretage mere konsekvente og præcise vurderinger af skader på køretøjer. Denne udvikling reducerer svindel og effektiviserer erstatningsprocessen.
Datamatsyn er en af de mest bemærkelsesværdige ting, der er kommet ud af deep learning- og kunstig intelligens-verdenen. De fremskridt, som deep learning har bidraget med til datamatsynsfeltet, har virkelig gjort dette felt til noget særligt.
Få mere at vide om det tværfaglige felt datavidenskab
Datamatsyn til beskyttelse af dyr
Lær, hvordan en datamatsynsmodel, der er designet til at analysere dyrespor, fungerer. Kan computeren trænes til at se et fodaftryk, ligesom en lokal dyresporfinder ville gøre? Se, hvordan computeren bearbejder de forskellige lag af information for at identificere dyret og dets køn. I denne video viser Jared Peterson, Senior Manager of SAS Advanced Analytics R&D, hvordan neurale netværk udgør videnskaben bag datamatsyn.
Se resultater med datamatsyn
Brugere af datamatsyn i mange brancher opnår reelle resultater - og vi har dokumenteret mange af dem i denne infografik. Vidste du for eksempel at:
- Datamatsyn kan skelne mellem iscenesatte og reelle skader på biler?
- Datamatsyn gør ansigtsgenkendelse muligt i sikkerhedsapplikationer?
- Datamatsyn gør automatisk checkout mulig i moderne detailbutikker.
Fra at spotte fejl i produktionen til at opdage tidlige tegn på plantesygdomme i landbruget bruges datmatsyn inden for flere områder, end du måske ville forvente.
Klik på infografikken her for at se resultater fra detailhandel, bankvæsen, sundhedsvæsen og meget mere.
Sådan fungerer datamatsyn
Datamatsyn fungerer i tre grundlæggende trin:
Hentning af et billede
Billeder, selv store samlinger, kan indhentes til analyse i realtid via video, fotos eller 3D-teknologi.
Bearbejdning af billedet
Deep learning-modeller automatiserer en stor del af denne proces, men modellerne trænes ofte ved først at blive fodret med tusindvis af klassificerede eller præidentificerede billeder.
At forstå billedet
Det sidste trin er det fortolkende trin, hvor et objekt identificeres eller klassificeres.
Nutidens AI-systemer kan gå et skridt videre og foretage handlinger baseret på en forståelse af billedet. Der findes mange former for datamatsyn, som alle bruges på forskellige måder:
- Billedsegmentering opdeler et billede i flere områder eller dele, der skal undersøges separat.
- Objektdetektion identificerer et specifikt objekt i et billede. Avanceret objektregistrering genkender mange objekter i et enkelt billede: en fodboldbane, en offensiv spiller, en defensiv spiller, en bold og så videre. Disse modeller bruger en X,Y-koordinat til at skabe en afgrænsende boks og identificere alt inden for boksen.
- Ansigtsgenkendelse er en avanceret form for objektdetektering, der ikke kun genkender et menneskeansigt på et billede, men også identificerer det som en bestemt person.
- Kantdetektion er en teknik, der bruges til at identificere yderkanten af et objekt eller et landskab for bedre at kunne identificere, hvad der er på billedet.
- Mønstergenkendelse er en proces, hvor man genkender gentagne former, farver og andre visuelle indikatorer i billeder.
- Billedklassificering grupperer billeder i forskellige kategorier.
- Egenskabsmatchning er en type mønsterdetektion, der matcher ligheder i billeder for at hjælpe med at klassificere dem.
Simple anvendelser af datamatsyn kan nøjes med at bruge en af disse teknikker, men mere avancerede anvendelsesmuligheder, som f.eks. datamatsyn til selvkørende biler, er afhængige af flere teknikker for at nå deres mål.
Udvalgt produkt til datamatsyn
SAS® Visual Data Mining og Machine Learning
Denne SAS-løsning understøtter klyngedannelse, forskellige former for regression, tilfældige træer, gradient boosting-modeller, supportvektormaskiner, sentimentanalyse og meget mere, foruden deep learning. Et interaktivt, visuelt pipeline-miljø præsenterer hvert projekt (eller mål) som en række farvekodede trin, der forekommer i en logisk rækkefølge.
Anbefalet læsestof
- Article Analytics: A must-have tool for leading the fight on prescription and illicit drug addictionStates and MFCUs now have the analytics tools they need to change the trajectory of the opioid crisis by analyzing data and predicting trouble spots – whether in patients, prescribers, distributors or manufacturers. The OIG Toolkit with free SAS® programming code makes that possible.
- Article Five AI TechnologiesDo you know the difference between artificial intelligence and machine learning? And can you explain why computer vision is an AI technology? Find out in this short explainer.
- Article What do drones, AI and proactive policing have in common?Law enforcement and public safety agencies must wrangle diverse data sets – such as data from drones – in their proactive policing operations. To be most effective, they need modern tools that support AI techniques like machine learning, computer vision and natural language processing.