Computer Vision

Was es ist und was man darüber wissen sollte

Computer Vision ist ein Teilbereich der Artificial Intelligence, der Computern die Interpretation und das Verständnis der visuellen Welt ermöglichen soll. Anhand von digitalen Bildern und Videos sowie mithilfe von Deep Learning-Modellen können Maschinen Objekte korrekt identifizieren und klassifizieren – und dann auf das „Gesehene“ reagieren.

Die Geschichte der Computer Vision

Frühe Experimente im Computer Vision-Bereich fanden in den 1950er Jahren statt. Mithilfe einiger der ersten neuronalen Netze wurden die Umrisse von Objekten erkannt und einfache Objekte wurden in Kategorien wie Kreise und Rechtecke eingeordnet. In den 1970er Jahren wurde Computer Vision erstmals kommerziell zur Interpretation maschinengeschriebener oder handschriftlicher Texte mittels optischer Zeichenerkennung genutzt. Diese Fortschritte ermöglichten die Interpretation schriftlicher Texte für Blinde.

Mit dem Ausbau des Internets in den 1990ern wurden große Mengen von Bildern online verfügbar, die analysiert werden konnten, was der Gesichtserkennung zum Durchbruch verhalf. Dank dieser wachsenden Datenmengen wurde es möglich, mit Maschinen bestimmte Menschen in Fotos und Videos zu identifizieren.

Heute führt das Zusammenspiel einer Reihe von Faktoren zu einer Renaissance der Computer Vision:

Dank mobiler Technologien mit eingebauten Kameras steht weltweit eine Unmenge von Fotos und Videos zur Verfügung.

Rechenleistung ist mittlerweile erschwinglicher und leicht erhältlich.

Speziell für Computer Vision und Analyse geeignete Hardware ist weiter verbreitet als früher.

Neue Algorithmen wie konvolutionale neuronale Netze können die von Hardware und Software gebotenen Möglichkeiten nutzen.

Diese Fortschritte haben Computer Vision erstaunlich weit vorangebracht. Die Trefferquote bei der Objekterkennung und ‑klassifikation ist in weniger als 10 Jahren von 50 auf 99 Prozent gestiegen – und die heutigen Systeme können visuelle Inputs präziser schnell erkennen und darauf reagieren als der Mensch.

Computer Vision gleicht einem Puzzle

Computer stellen Bilder so zusammen, wie Sie ein Puzzle zusammenstecken würden.

Wie gehen Sie bei einem Puzzle vor? Sie haben viele Teile, die Sie zu einem größeren Bild zusammenfügen wollen. So funktionieren auch neuronale Netze für Computer Vision. Sie unterscheiden viele unterschiedliche Teile des Bilds, machen die Umrisse ausfindig und modellieren dann die Teilelemente. Mit Filterung und einer Reihe von Aktionen in tiefen Netzschichten können sie die Teile des Bildes zusammenfügen, ganz wie bei einem Puzzle.

Dem Computer liegt zwar nicht das fertige Bild auf dem Karton des Puzzles vor, aber er wird häufig anhand von Hunderten oder sogar Tausenden ähnlichen Bildern darauf trainiert, bestimmte Objekte zu erkennen.

Anstatt dem Computer beizubringen, Schnurrhaare, buschige Schwänze oder spitze Ohren als Katze zu erkennen, laden die Programmierer Millionen von Katzenfotos in den Computer und danach lernt das Modell eigenständig, welche verschiedenen Eigenschaften eine Katze ausmachen.

Computer Vision in der Welt von heute

Von der Gesichtserkennung bis zur Verarbeitung des Geschehens bei einem Fußballspiel ist Computer Vision dem Sehvermögen des Menschen in vielen Bereichen ebenbürtig oder überlegen.

Deep Learning und Computer Vision

Wie bringt Deep Learning einem Computer das Sehen bei? Erfahren Sie, wie die verschiedenen Typen neuronaler Netze funktionieren und wie sie für Computer Vision genutzt werden.

HERUNTERLADEN

Bildanalyse und AI

Schauen Sie sich eine Einführung in die Bildanalyse an und lernen Sie analytische Verfahren kennen, die auf Bilddaten angewendet werden können.

Webinar ansehen

Demo zur Gesichtserkennung

Erfahren Sie mehr über die zugrunde liegenden Verfahren und die erforderlichen Datenverarbeitungsschritte für Gesichtserkennung und Computer Vision. Diese Demo zeigt, wie ein SAS^® Viya^® Modell Bilder von Gesichtern erkennt, ausrichtet, darstellt und klassifiziert.

Demo ansehen

Mehr Informationen über Branchen, die diese Technologie nutzen

Computer Vision ist eine der bemerkenswertesten Errungenschaften von Deep Learning und Artificial Intelligence. Mithilfe von Deep Learning wurden bei Computer Vision herausragende Fortschritte erzielt. Wayne Thompson SAS Data Scientist

Computer Vision zum Schutz bedrohter Tierarten

Erfahren Sie, wie ein Computer Vision-Modell zur Analyse von Tierspuren funktioniert. Kann der Computer so trainiert werden, dass er Tierspuren fast wie einheimische Fährtenleser erkennen kann? Schauen Sie sich an, wie der Computer die verschiedenen Informationsschichten verarbeitet, um das Tier und sein Geschlecht zu ermitteln. In diesem Video erläutert Jared Peterson, Senior Manager of SAS Advanced Analytics R&D, wie neuronale Netze die wissenschaftliche Grundlage für Computer Vision bilden.

Erfahren Sie, wie WildTrack bedrohte Arten schützt

Handfeste Ergebnisse mit Computer Vision

Mit Computer Vision werden in vielen Branchen ganz handfeste Ergebnisse erzielt. In dieser Infografik haben wir viele davon dokumentiert. Wussten Sie zum Beispiel, dass:

Computer Vision zwischen fingierten und echten Schäden an Fahrzeugen unterscheiden kann?
Computer Vision die Gesichtserkennung für Sicherheitsanwendungen ermöglicht?
Computer Vision automatische Bezahlsysteme für den modernen Einzelhandel möglich macht?

Computer Vision wird in mehr Bereichen eingesetzt, als Sie vielleicht erwarten würden, von der Erkennung von Defekten in der Produktion bis zur Erkennung der ersten Anzeichen von Pflanzenkrankheiten in der Landwirtschaft.

Klicken Sie auf die Infografik, um Ergebnisse aus Einzelhandel, Bankwesen, Gesundheitswesen und mehr anzuzeigen.

So funktioniert Computer Vision

Computer Vision umfasst drei grundlegende Schritte:

Bilderfassung

Bilddaten, und zwar auch in großer Menge, können mittels Videos, Fotos oder 3D-Technologie in Echtzeit zu Analysezwecken erfasst werden.

Bildverarbeitung

Dieser Prozess wird mit Deep Learning-Modellen weitgehend automatisiert, aber für das anfängliche Training der Modelle werden häufig Tausende von bereits gekennzeichneten oder vorab identifizierten Bildern eingespielt.

Bildverständnis

In diesem Schritt erfolgt die Interpretation und das Objekt wird identifiziert bzw. klassifiziert.

Die heutigen AI-Systeme können in einem weitergehenden Schritt sogar auf der Grundlage des Bildverständnisses Maßnahmen ergreifen. Es gibt viele Computer Vision-Typen, die unterschiedlich eingesetzt werden:

Bildsegmentierung: Ein Bild wird in mehrere Bereiche oder Teile unterteilt, die dann getrennt untersucht werden.
Objekterkennung: dient zum Identifizieren eines bestimmten Objekts in einem Bild. Hochentwickelte Objekterkennungssysteme können viele Objekte in einem einzigen Bild erkennen: ein Fußballfeld, einen Spieler in der Offensive, einen Spieler in der Defensive, einen Ball usw. Diese Modelle erstellen mithilfe einer X-Y-Koordinate ein Begrenzungsfeld und identifizieren alles innerhalb des Felds.
Gesichtserkennung: eine hochentwickelte Form der Objekterkennung, mit der nicht nur menschliche Gesichter in Bildern erkannt, sondern sogar bestimmte Personen identifiziert werden können.
Kantenerkennung: ein Verfahren, mit dem sich die Außenkante eines Objekts oder einer Landschaft identifizieren lässt, damit besser zu erkennen ist, was sich im Bild befindet.
Mustererkennung: ein Prozess zur Erkennung wiederholter Formen, Farben und anderer visueller Merkmale in Bildern.
Bildklassifikation: dient zur Gruppierung von Bildern in verschiedene Kategorien.
Merkmalsabgleich: eine Art der Mustererkennung, die Ähnlichkeiten in Bildern findet, um diese klassifizieren zu können.

Bei einfachen Computer Vision-Anwendungen wird unter Umständen nur eins dieser Verfahren eingesetzt, aber in hochentwickelten Einsatzbereichen wie beispielsweise autonom fahrenden Autos werden mehrere Verfahren kombiniert, um das Ziel zu erreichen.

Nächste Schritte

Sehen ist Glauben. Entdecken Sie, zu welchen Ergebnissen Ihnen SAS mit Computer Vision verhelfen kann.

Computer Vision von SAS

Speziell für Computer Vision

SAS^® Visual Data Mining and Machine Learning

Diese SAS Lösung unterstützt neben Deep Learning auch Clustering, verschiedene Regressionsverfahren, Random Forests, Gradient Boosting-Modelle, Support Vector Machines, Sentimentanalyse und mehr. Eine interaktive, visuelle Pipeline-Umgebung präsentiert jedes Projekt (oder Ziel) als eine Reihe farbcodierter Schritte, die in einer logische Abfolge ausgeführt werden.

Kostenlos testen

Computer Vision

Was es ist und was man darüber wissen sollte