Computer Vision
Vad är det och varför är det viktigt
Computer vision är ett delområden inom artificiell intelligens som tränar datorer att förstå den visuella världen. Genom att använda digitala bilder från kameror och video med djupinlärning kan maskiner identifiera och klassificera objekt - och därefter agera på vad de ser.
Datorseende: Historia
Tidiga experiment i computer vision ägde rum på 1950-talet. Med några av de första neurala nätverken lärde man maskiner att upptäcka kanterna på ett objekt och sortera objekt i kategorier, som runda cirklar och kvadrater. På 1970-talet användes datorseende för första gången kommersiellt genom att tolka maskinskriven och handskriven text med optisk teckenigenkänning. Detta framsteg ledde till de första tillämpningarna av att tolka skriven text för blinda.
När internet mognade på 90-talet blev det möjligt att publicera stora uppsättningar av bilder online för analys, vilket ledde till att program för ansiktsigenkänning blomstrade. Dessa växande datamängder hjälpte till att göra det möjligt för maskiner att identifiera specifika personer i foton och videor.
Idag har ett antal faktorer konvergerat för att åstadkomma en renässans inom datorseende:
Mobil teknologi med inbyggda kameror har tagit över vad det gäller bilder och video.
Datorkraft har blivit har blivit mer överkomlig och lättillgänglig.
Hårdvara för computer vision och analys finns tillgängligt världen över.
Nya algoritmer som konvolutionerande neurala nätverk kan dra nytta av funktionerna i hårdvara och mjukvara.
Effekterna från framstegen inom datorseende är häpnadsväckande. Noggrannhetsgraden för objektidentifiering och klassificering har gått från 50 procent till 99 procent på mindre än ett decennium. Dagens system är till och med snabbare och mer exakta än människor på att upptäcka samt reagera på visuell input.
Hear why Georgia-Pacific chose SAS
Datorseende liknas med pussel
Datorer sätter ihop visuella bilder på samma sätt som du själv lägger ett pussel.
Tänk på hur du tar dig an ett pussel. Du har alla bitarna, och du måste sätta ihop dem till en färdig bild. Det är så neurala nätverk för datorseende fungerar. De särskiljer många olika delar av bilden, identifierar kanterna och modellerar sedan alla delkomponenter. Genom att använda filtrering och koppla olika åtgärder genom flera djupa lager av artificiella neuronnät skapas bilden. Ungefär som du skulle göra när du lägger ett pussel.
Datorn får inte se den slutliga bilden på lådan med pusslet, som du får göra, istället tränas den med hundratals eller tusentals relaterade bilder för att känna igen specifika objekt.
Istället för att träna datorer att leta efter morrhår, svansar och spetsiga öron för att känna igen en katt, laddar man upp miljontals bilder på katter. Därefter lär sig modellen på egen hand att identifiera kattens alla egenskaper.
Computer vision i dagens värld
Från att känna igen ansikten till att bearbeta fotbollsmatcher i realtid överträffar datorseende våra mänskliga visuella förmågor inom många olika områden.
Deep learning och computer vision
Lär dig hur de olika typerna av neurala nätverk fungerar och hur de används för datorseende.
Bildanalys och AI
Ta del av vår introduktion till bildanalys och lär dig mer om hur analytiska tekniker kan tillämpas på bilddata.
Demo av ansiktsigenkänning
Lär dig om tekniker och hur data bearbetats för att lyckas med ansiktsigenkänning och datorseende. Den här demon visar hur en SAS® Viya®-modell upptäcker, klassificerar och justerar ansiktsbilder.
Vem använder datorseende?
Datorseende används inom olika branscher för att förbättra kundupplevelsen, minska kostnaderna och öka säkerheten.
Retail
Retailers can use computer vision to enhance the shopping experience, increase loss prevention and detect out-of-stock shelves. Computer vision is already helping customers checkout more quickly – aiding using self-checkout machines or combining with machine learning to alleviate the checkout process completely.
Manufacturing
In manufacturing, businesses use computer vision to identify product defects in real time. As the products are coming off the production line, a computer processes images or videos, and flags dozens of different types of defects — even on the smallest of products.
Public Sector
Public sector agencies use computer vision to better understand the physical condition of assets under their control, including equipment and infrastructure. Computer vision can help agencies perform predictive maintenance by analyzing equipment and infrastructure images to make better decisions on which of these require maintenance. In addition, computer vision is used to help monitor compliance with policies and regulations. For example, computer vision can be used to detect contraband in cargo, flag potential safety violations in buildings, review labels for adherence to guidelines, and ensure compliance with conservation regulations. Finally, as drones become used for more defense and homeland security needs, the use of analytics to identify and analyze critical elements from the visual feed will rise to the forefront of computer vision use cases in the public sector.
Health Care
In the medical field, computer vision systems thoroughly examine imagery from MRIs, CAT scans and X-rays to detect abnormalities as accurately as human doctors. Medical professionals also use neural networks on three-dimensional images like ultrasounds to detect visual differences in heartbeats and more.
Insurance
In the insurance industry, companies use computer vision to conduct more consistent and accurate vehicle damage assessments. The advancement is reducing fraud and streamlining the claims process.
Computer vision is one of the most remarkable things to come out of the deep learning and artificial intelligence world. The advancements that deep learning has contributed to the computer vision field have really set this field apart.
Learn about the multidisciplinary field of data science
Computer vison är en av de mest anmärkningsvärda metoderna som samarbetet mellan djupinlärning och artificiell intelligens tagit fram. Framstegen som djupinlärning bidragit med till datorseende har verkligen gjort detta till något unikt. Wayne Thompson SAS Data Scientist
Datorseende för att skydda djurriket
Lär dig mer om hur en datorseende utformat för att analysera djurspår fungerar. Kan datorn tränas att se ett tassavtryck ungefär som en djurspårare? Se hur datorn bearbetar olika lager av information för att identifiera djuret och dess kön. I den här videon visar Jared Peterson, Senior Manager för SAS Advanced Analytics R&D, hur neurala nätverk är vetenskapen bakom datorseende.
Resultat med computer vision
Inom många olika branscher får användare av datorseende riktiga resultat. Vi har dokumenterat många av dessa i denna infografik. Visste du till exempel:
- Att datorseende kan skilja mellan självförvållade och verkliga bilskador?
- Att datorseende möjliggör ansiktsigenkänning för flera säkerhetsapplikationer?
- Att datorseende gör det möjligt att ha automatisk utcheckning i butiker?
Från att upptäcka defekter i tillverkning till att tidigt identifiera tecken på växtsjukdomar för jordbruk används datorseende inom fler branscher än man först kan tro.
Klicka på infografiken för att se resultat från branscher som detaljhandel, bank, sjukvård och fler.
Så här fungerar datorseende
Datorseende i tre enkla steg:
Få bilder
Bilder, även i stora mängder, kan fås i realtid genom video, foto eller 3D-teknik för analys.
Processa bilder
Modeller för djupinlärning automatiserar stora delar av processen. Modellerna tränas ofta genom att först matas med tusentals märkta eller föridentifierade bilder.
Förstå bilder
Sista steget är att tolka och förstå ett objekt som identifieras eller klassificeras.
Dagens Dagens AI-system kan gå ett steg längre och vidta åtgärder baserat på en förståelse av bilden. Det finns många varianter av datorseende som alla används på olika sätt:
- Bildsegmentering delar upp en bild i flera regioner eller delar som undersöks separat.
- Objektdetektering identifierar ett specifikt objekt i en bild. Avancerad objektdetektering känner igen många objekt i en enda bild: en fotbollsplan, en offensiv spelare, en defensiv spelare, en boll och så vidare. Dessa modeller använder X,Y-koordinater för att skapa en ram och därefter identifiera allt inuti ramen.
- Ansiktsigenkänning är en avancerad typ av objektdetektering som inte bara känner igen ett mänskligt ansikte på en bild utan även identifierar individer.
- Kantdetektering är en teknik som används för att identifiera de yttre kanterna av ett objekt eller landskap, för att bättre kunna identifiera vad som finns i bilden.
- Mönsterdetektering är en process för att känna igen upprepade former, färger och andra visuella indikatorer i bilder.
- Bildklassificering grupperar bilder i olika kategorier.
- Funktionsmatchning är en typ av mönsterdetektering som matchar likheter i bilder för att bättre kunna klassificera dem.
Enkla användningsområden av datorseende kanske bara använder en av dessa tekniker, men mer avancerad användning, som datorseende för självkörande bilar, förlitar sig på flera.
Nästa steg
Upptäck vad SAS kan göra för att du ska uppnå ditt mål med computer vision.
Utvalda produkter för Computer Vision
SAS® Visual Data Mining and Machine Learning
Denna SAS-lösning stöder klustring, olika varianter av regressionsanalys, random forests, modeller för gradient boosting, stöd för vektormaskiner, sentimentanalys och mer, utöver djupinlärning. En interaktiv och visuell pipeline presenterar varje projekt (eller mål) som en serie färgkodade steg som sker i en logisk sekvens.
Rekommenderad läsning
- Insights Page Break stuff . . . servers, rules and the glass ceilingCarla Gentry knows what it’s like to be the only woman on the team and is happy to share her hard-won knowledge with an ever-growing number of female data scientists. She recently shared with us some sage advice for women entering or interested in advancing in the field.
- Article How to drill a better hole with analyticsFrom drilling holes to preventing health care fraud, learn about some of the new technologies SAS has patented with IoT and machine learning technologies.
- Article How to improve your AI marketing skillsMarketing teams can use current AI capabilities to enhance their efforts around campaign automation, dynamic pricing based on forecasting models, and by providing more relevant, real-time customer offers.