Computer Vision
Co to jest i dlaczego jest takie ważne
Rozpoznawanie obrazów to dziedzina sztucznej inteligencji, polegająca na uczeniu komputerów, jak interpretować i rozumieć świat wizualny. Urządzenia, wykorzystując cyfrowe obrazy z kamer i filmów oraz modele uczenia głębokiego, mogą dokładnie identyfikować i klasyfikować obiekty, a następnie reagować na to, co „widzą”.
Historia
Pierwsze eksperymenty w zakresie rozpoznawania obrazu miały miejsce w latach 50. ubiegłego wieku. Do ich przeprowadzenia użyto jednych z pierwszych sieci neuronowych w celu wykrywania krawędzi i przypisywania prostych obiektów do kategorii, takich jak okrągłe i kwadratowe. W latach 70. ubiegłego wieku po raz pierwszy zastosowano rozpoznawanie obrazów do celów komercyjnych. Technologia ta interpretowała tekst pisany na maszynie lub ręcznie, wykorzystując optyczne rozpoznawanie znaków. Te postępy wykorzystano do rozpoznawania tekstu dla niewidomych.
Wraz z rozwojem Internetu w latach 90. XX wieku, który doprowadził do udostępnienia w sieci dużych zbiorów obrazów do analizy, pojawiły się korzystne warunki do rozwoju programów do rozpoznawania twarzy. Te powiększające się zbiory danych umożliwiły urządzeniom ustalanie tożsamości poszczególnych osób na zdjęciach i filmach.
Dzisiaj mamy do czynienia z wieloma czynnikami, które wspólnie przyczyniły się do rozkwitu technologii rozpoznawania obrazów:
Telefony komórkowe z wbudowanymi aparatami fotograficznymi doprowadziły do stworzenia olbrzymiej globalnej biblioteki zdjęć i filmów.
Moc obliczeniowa stała się łatwo dostępna i bardziej przystępna cenowo.
Sprzęt do rozpoznawania obrazów i analizy komputerowej jest łatwo dostępny.
Nowe algorytmy, takie jak splotowe sieci neuronowe, są w stanie wykorzystywać te możliwości oferowane przez sprzęt i oprogramowanie.
Skutki tych postępów na polu rozpoznawania obrazów są zdumiewające. Wskaźniki dokładności rozpoznawania i klasyfikacji przedmiotów wzrosły z 50 do 99 procent w ciągu mniej niż dekady – a dzisiejsze systemy są dokładniejsze niż ludzie pod względem szybkiego wykrywania sygnałów wizualnych i reagowania na nie.
Nowa era w leczeniu nowotworów
Tradycyjne metody oceny guzów nowotworowych są niezwykle czasochłonne. Takie metody korzystające z niewielkiej ilości danych mogą prowadzić do błędów i bywają mało obiektywne. Szpital Uniwersytecki w Amsterdamie we współpracy z SAS wprowadził przełomowe zmiany w diagnozowaniu nowotworów dzięki wykorzystaniu sztucznej inteligencji. Lekarze, korzystając z technologii rozpoznawania obrazów i modelów uczenia głębokiego do zwiększenia szybkości i dokładności oceny reakcji pacjentów na chemioterapię, mogą szybciej i z ratującą życie precyzją identyfikować pacjentów chorych na raka, dla których korzystna byłaby operacja.
Rozpoznawanie obrazów przypomina układankę
Komputery składają obrazy jak puzzle.
W jaki sposób Ty je układasz? Musisz ułożyć wszystkie elementy w obraz. Tak działają sieci neuronowe wykorzystywane do rozpoznawania obrazów. Rozróżniają wiele różnych fragmentów danego obrazu, wykrywają krawędzie, a następnie modelują elementy cząstkowe. Korzystając z filtrowania i serii działań na głębokich warstwach sieci, łączą ze sobą części obrazu jak puzzle.
Komputer nie ma podpowiedzi w postaci obrazu na wierzchu pudełka – ale często udostępnia się mu setki lub tysiące powiązanych obrazów, aby nauczyć go rozpoznawać poszczególne obiekty.
Zamiast uczyć komputery jak szukać wąsów, ogona i spiczastych uszu, aby rozpoznać kota, programiści udostępniają miliony zdjęć kotów, a model sam uczy się, jak wyglądają poszczególne części ciała tego zwierzęcia.
Rozpoznawanie obrazów w dzisiejszym świecie
Od rozpoznawania twarzy po przetwarzanie na żywo przebiegu meczu piłki nożnej, rozpoznawanie obrazów rywalizuje z ludzkimi zdolnościami wzrokowymi, a w wielu obszarach je przewyższa.
Ucenie głębokie i rozpoznawanie obrazów
Jak uczenie głębokie uczy komputer widzieć? Zapoznaj się z technikami i zastosowaniami uczenia głębokiego i dowiedz się, jak różne typy modeli głębokich sieci neuronowych są wykorzystywane w wizji komputerowej.
Kolejny zestaw oczu dzięki wizji komputerowej
Firma Georgia-Pacific wdrożyła wizję komputerową w codziennych operacjach produkcyjnych w celu przechwytywania i analizowania obrazów. Poprzez ciągłe monitorowanie anomalii, technologia ta pomaga rozwiązywać problemy związane z jakością produktów i bezpieczeństwem oraz zwiększa wydajność.
THE BATTING LAB
Batting Lab łączy sztuczną inteligencję, wizję komputerową i analitykę IoT z baseballem, aby pomóc dzieciom poprawić ich wyniki sportowe i rozwijać umiejętność korzystania z danych. Czujniki i kamery wykorzystują wykrywanie obiektów do zbierania punktów danych i przetwarzania nagrań, tworząc w czasie rzeczywistym rekomendacje dla zawodników.
Kto korzysta z technologii rozpoznawania obrazów?
Rozpoznawanie obrazów jest wykorzystywane w różnych branżach w celu poprawy doświadczeń konsumentów, optymalizacji kosztów i podnoszenia poziomu bezpieczeństwa.
- Wybierz branżę
- Handel detaliczny
- Przemysł
- Sektor publiczny
- Ochrona Zdrowia
- Obrona i bezpieczeństwo
- Ubezpieczenia
Handel detaliczny
Sprzedawcy detaliczni mogą korzystać z rozpoznawania obrazów, aby poprawić doświadczenia klientów podczas zakupów, lepiej zapobiegać stratom i wykrywać braki magazynowe. Już teraz rozpoznawanie obrazów pomaga klientom w szybszym robieniu zakupów przy użyciu kas samoobsługowych lub, w połączeniu z uczeniem maszynowym, poprzez całkowite wyeliminowanie kas.
Przemysł
W przemyśle firmy wykorzystują rozpoznawanie obrazów do identyfikowania na bieżąco wad fabrycznych. Gdy produkty schodzą z linii produkcyjnej, komputer przetwarza obrazy lub filmy wideo i wykrywa dziesiątki różnych rodzajów wad – nawet na najmniejszych produktach.
Sektor publiczny
Podmioty z sektora publicznego wykorzystują rozpoznawanie obrazów, aby lepiej rozumieć stan fizyczny kontrolowanych aktywów, w tym sprzętu i infrastruktury. Rozpoznawanie obrazu pomaga tym podmiotom w prowadzeniu konserwacji predykcyjnej poprzez analizę sprzętu i infrastruktury z myślą o podejmowaniu lepszych decyzji dotyczących tego, które z nich wymagają konserwacji. Ponadto podmioty z sektora publicznego wykorzystują rozpoznawanie obrazów do monitorowania zgodności z zasadami i regulacjami. Na przykład mogą korzystać z rozpoznawania obrazów do wykrywania przemycanych towarów w ładunku, do sygnalizowania potencjalnych naruszeń bezpieczeństwa w budynkach, do sprawdzania etykiet pod kątem zgodności z wytycznymi i do zapewniania zgodności z przepisami dotyczącymi ochrony zwierząt i roślin. W miarę popularyzacji dronów do zastosowań w obronności i bezpieczeństwie wewnętrznym, zastosowanie analityki do wykrywania i analizy krytycznych elementów z przekazanych informacji wizualnych urośnie do rangi głównej technologii rozpoznawania obrazów w sektorze publicznym.
Ochrona Zdrowia
W dziedzinie medycyny komputerowe systemy rozpoznawania obrazu analizują zdjęcia z rezonansu magnetycznego, tomografii komputerowej i rentgena, aby wykrywać nieprawidłowości równie dokładnie jak lekarze. Pracownicy opieki zdrowotnej wykorzystują również sieci neuronowe do pracy z trójwymiarowymi obrazami, np. z USG, aby wykrywać wizualne różnice w uderzeniach serca i nie tylko.
Obronność i bezpieczeństwo
W środowiskach wymagających wysokiego poziomu bezpieczeństwa, takich jak bankowość i kasyna, firmy wykorzystują rozpoznawanie obrazów do dokładniejszej identyfikacji klientów, gdy w grę wchodzą duże kwoty. Strażnicy, w odróżnieniu od algorytmu rozpoznawania obrazów, nie są w stanie analizować setek nagrań wideo jednocześnie.
Ubezpieczenia
W branży ubezpieczeniowej firmy wykorzystują rozpoznawanie obrazów do dokładniejszych i bardziej spójnych ocen uszkodzeń pojazdów. Postępy pomagają ograniczyć liczbę oszustw i uprościć proces rozpatrywania roszczeń.
Rozpoznawanie obrazów to jedno z najbardziej niezwykłych zastosowań ze świata uczenia głębokiego i sztucznej inteligencji. Postępy, jakie uczenie głębokie wniosło na polu komputerowego rozpoznawania obrazów, sprawiły, że dziedzina ta znacznie zyskała na znaczeniu.
Poznaj dziedzinę data science
Rozpoznawanie obrazów w ochronie przyrody
Dowiedz się, jak działa model rozpoznawania obrazów zaprojektowany do analizy śladów zwierząt. Czy komputer można nauczyć, by rozpoznawał tropy niczym zaprawiony w bojach tropiciel zwierząt? Zobacz, jak komputer przetwarza różne warstwy informacji, aby określić zwierzę i jego płeć. W tym filmie Jared Peterson, starszy kierownik działu badawczo-rozwojowego SAS Advanced Analytics, wyjaśnia, dlaczego rozpoznawanie obrazów wymaga zastosowania sieci neuronowych.
Sprawdź wyniki uzyskane dzięki rozpoznawaniu obrazów
Użytkownicy technologii rozpoznawania obrazów dostrzegają prawdziwe rezultaty – a my udokumentowaliśmy wiele z nich na tej infografice. Czy wiesz na przykład, że:
- Rozpoznawanie obrazów pozwala odróżnić zainscenizowane i prawdziwe szkody samochodowe?
- Rozpoznawanie obrazów umożliwia rozpoznawanie twarzy w zastosowaniach związanych z bezpieczeństwem?
- Dzięki rozpoznawaniu obrazów w nowoczesnych sklepach możemy kupować bez odwiedzania kasy.
Począwszy od wykrywania wad fabrycznych po diagnozowanie wczesnych oznak chorób roślin w rolnictwie, rozpoznawanie obrazu jest stosowane w większej liczbie obszarów niż można by się spodziewać.
Kliknij infografikę, aby zobaczyć wyniki z branży sprzedaży detalicznej, bankowości, opieki zdrowotnej i innych sektorów.
Jak działa rozpoznawanie obrazów
Rozpoznawanie obrazów przebiega w trzech podstawowych krokach:
Pozyskiwanie obrazu
Obrazy do analizy, nawet duże zbiory, można pozyskiwać w czasie rzeczywistym za pomocą materiałów wideo, zdjęć lub technologii 3D.
Przetwarzanie obrazu
Choć modele uczenia głębokiego automatyzują sporą część tego procesu, modele są często nauczane poprzez udostępnianie im tysięcy oznaczonych lub wstępnie zidentyfikowanych obrazów.
Interpretacja obrazu
Ostatnim etapem jest interpretacja, podczas której dokonywana jest identyfikacja lub klasyfikacja obiektu.
Dzisiejsze systemy AI idą o krok dalej i mogą podejmować działania na podstawie rozpoznanego obrazu. Istnieje wiele rodzajów rozpoznawania obrazów, które są wykorzystywane na różne sposoby:
- Segmentacja obrazów dzieli obraz na wiele obszarów lub części, które są analizowane oddzielnie.
- Wykrywanie obiektów identyfikuje określony obiekt na obrazie. Zaawansowane wykrywanie obiektów rozpoznaje wiele obiektów na pojedynczym obrazie: boisko piłkarskie, napastnika, obrońcę, piłkę itp. Modele te wykorzystują współrzędne X i Y do utworzenia pola ograniczającego i identyfikują wszystko, co znajduje się wewnątrz niego.
- Rozpoznawanie twarzy to zaawansowany rodzaj rozpoznawania obiektów, który nie tylko rozpoznaje na obrazie ludzką twarz, ale też ustala tożsamość danej osoby.
- Wykrywanie krawędzi to technika stosowana do ustalania zewnętrznej krawędzi obiektu lub krajobrazu w celu lepszej identyfikacji tego, co znajduje się na danym obrazie.
- Wykrywanie wzorców to proces rozpoznawania powtarzających się kształtów, kolorów i innych cech wizualnych na obrazach.
- Klasyfikacja obrazów grupuje obrazy w różne kategorie.
- Dopasowywanie cech to rodzaj wykrywania wzorców polegający na dopasowywaniu podobieństw na obrazach, aby je sklasyfikować.
Proste rozwiązania z zakresu rozpoznawania obrazów często wykorzystują tylko jedną z tych technik, ale bardziej zaawansowane, np. rozpoznawanie obrazów w samochodach autonomicznych, polegają na wielu technikach, aby osiągnąć cel.
Kierunki rozwoju
Sprawdź to sam. Dowiedz się, co możesz osiągnąć dzięki technologii rozpoznawania obrazów SAS.
Rozwiązanie
SAS® Visual Data Mining and Machine Learning
To rozwiązanie SAS obsługuje klastrowanie, różne odmiany regresji, lasy losowe, wzmocnienie gradientowe, maszyny wektorów nośnych, analizę sentymentu i techniki uczenia głębokiego. Interaktywne, wizualne stopniowane środowisko reprezentuje każdy projekt (lub cel) jako serię oznaczonych kolorystycznie kroków następujących w logicznej kolejności.
Polecane materiały
- Artykuł Five AI TechnologiesDo you know the difference between artificial intelligence and machine learning? And can you explain why computer vision is an AI technology? Find out in this short explainer.
- Artykuł GDPR and AI: Friends, foes or something in between?The GDPR may not be best buddies with artificial intelligence – but GDPR and AI aren't enemies, either. Kalliopi Spyridaki explains the tricky relationship between the two.
- Artykuł Wanted: AI leadersDo you have what it takes to be an AI leader? In this growing field, people skills, innovation and ethics are more important than expertise in artificial intelligence technologies.