Produkte und Lösungen / Was ist Machine Learning?

Was ist Machine Learning?

"Menschen können in der Regel ein bis zwei gute Modelle pro Woche erstellen, Machine Learning kann tausende Modelle pro Woche erstellen."

—Thomas H. Davenport

President's Distinguished Professor in
Management and Information Technology,

Babson College

Machine Learning ist ein Zweig der künstlichen Intelligenz, der den Aufbau von Systemen automatisiert, die aus Daten lernen, Muster identifizieren und zukünftige Ergebnisse vorhersagen – mit minimaler menschlicher Intervention. Es teilt viele Ansätze mit statistischer Modellierung, Data Mining, Informationsrückgewinnung und anderen verwandten Bereichen.

Wenn jemand beispielsweise in einer bestimmten Situation Data Mining an einem bestimmten Datensatz mit einem bestimmten Ziel durchführt, wird er auch eine Reihe von Mustererkennungstechniken anwenden, die im Machine Learning entwickelt wurden.

Warum ist Machine Learning wichtig?

In Anbetracht von in nie gesehenem Ausmaß anwachsenden elektronischen Datenmengen, ständig steigendem Wettbewerbsdruck und wachsenden Kundenerwartungen sind Unternehmen bestrebt, effizient und effektiv Informationen aus Big Data zu extrahieren. Ein Schlüssel dazu ist die automatisierte Modellbildung – traditionell eine Domäne des Machine Learning.

Analytik-Vordenker Thomas H. Davenport schrieb am 11. September 2013 in der Onlineausgabe von The Wall Street Journal, dass in Anbetracht der sich rapide verändernden, wachsenden Datenmengen, „schnelle Modellierungssysteme benötigt werden, um mithalten zu können. Menschen können in der Regel ein bis zwei Modelle pro Woche erstellen, Machine Learning kann tausende erstellen.“1

Warum werden Machine-Learning-Algorithmen immer nützlicher?

Machine Learning ist nicht neu, aber es hat einen neuen Wendepunkt erreicht – einen, an dem explodierende Datenmengen auf Fortschritte in Hardware und Rechentechnik treffen. Das automatisierte Erstellen von analytischen Modellen, die größere, komplexere Datenmengen analysieren und schnellere Ergebnisse liefern können – selbst in sehr großem Rahmen – ermöglicht Problemlösungen, die zuvor nicht umsetzbar waren.

Machine-Learning-Algorithmen werden derzeit eingesetzt für die Betrugserkennung, natürliche Sprachverarbeitung für die Textanalyse, Spamfilter, Marktsegmentierung, Empfehlungsdienste, neue Preismodelle auf Basis von Daten aus Telematik oder Smart Metering, Netzwerkeinbrüche , medizinische Diagnostik und die Analyse von Daten mit Orts- und Zeitstempel. Mit der Zunahme von Volumen, Geschwindigkeit und Komplexität der Daten entdecken immer mehr Unternehmen, dass die besonderen Eigenschaften von Machine Learning ideal sind, um ihre sich rasant entwickelnden Bedürfnisse mit neuen Methoden zu bewältigen oder "das erkennen/verhindern von Netzwerkeinbrüchen"?

Ziele von Machine Learning

Es gibt viele mögliche Ziele für Machine Learning. Zwei der verbreitetsten sind überwachtes Lernen und unüberwachtes Lernen. Überwachtes Lernen beinhaltet bekannte Label (unabhängige Variablen) und wird für Aufgaben wie Klassifizierung und Vorhersage verwendet. Die Klassifizierungstechniken sind am ausgereiftesten und umfassen Entscheidungsbäume, Support Vector Machines, neurale Netzwerke und Random Forests.

Unüberwachtes Lernen beinhaltet keine Label und wird für Aufgaben wie Clustering und Dimensionsreduzierung verwendet. Die Techniken umfassen Clustering, selbstorganisierende Karten und Singulärwertzerlegung (zur Dimensionsreduzierung).

Weil Machine Learning ein Ansatz ist, der viele Algorithmen verwendet, kann auch ein allgemeiner Algorithmus wie logistische Regression (den viele Statistiker nicht als Machine Learning bezeichnen würden) in Machine-Learning-Anwendungen integriert werden.

Wie SAS helfen kann

SAS bietet einen modernen, prozessgesteuerten und automatisierten Ansatz für Predictive Analytics zur Prozessoptimierung. Als Marktführer in der erweiterten Analytik verfügt SAS über eine umfassende Auswahl von Machine-Learning-Algorithmen, mit denen Unternehmen sich ihre Big Data schnell zunutze machen können.

Wir hören bei SAS auf unsere Kunden und die Probleme, denen sie gegenüberstehen. Wir verfolgen genau die Forschung für vielversprechende neue Ansätze und setzen sorgfältig die Methoden um, die sich am besten für die Bewältigung der Probleme unserer Kunden eignen. Wir verbinden unsere besonders reiche Erfahrung und Sachkenntnis in Statistik und Data Mining mit den besten Neuentwicklungen in der Architektur, um die Effizienz von Methoden und Modellen zu gewährleisten – selbst in riesigen Unternehmensumgebungen.

SAS® Analytics-Produkte beinhalten Algorithmen aus verschiedenen Forschungsbereichen wie Statistik, Forecasting, Data Mining, Textanalyse und Optimierung. Diese Produkte werden mit dem gemeinsamen Ziel eingesetzt, Geschäfts- und Forschungsprozesse zu optimieren, sei es für Kundenmarketing und Kundendienst, Risikomanagement oder Fertigungsprozesse.

  • SAS® Enterprise MinerTM und sein Hochleistungs-Gegenstück SAS High-Performance Data Mining bieten viele hochgradig automatisierte überwachte und unüberwachte Techniken wie neurale Netzwerke, Entscheidungsbäume, Random Forests, Gradient Boosting, Support Vector Machines, Nearest-Neighbor Mapping, k-Means-Clustering und selbstorganisierende Karten.
  • Leistungsstarke, die Automatisierung unterstützende Optimierungstechniken für die lokale Suche, zum Beispiel genetische Algorithmen, werden in SAS/OR® und SAS High-Performance Optimization angeboten.
  • Der EM-Algorithmus, Multivariate Adaptive Regression Splines, Kerndichteschätzung und Hauptkomponentenanalyse können mit SAS/STAT® oder SAS High-Performance Statistics ausgeführt werden.
  • Der größte Teil der Datenzunahme wird durch unstrukturierte Daten verursacht. SAS Text Miner und SAS High-Performance Text Mining extrahieren mithilfe von herkömmlichen und Machine-Learning-Algorithmen automatisch Informationen aus großen unstrukturierten Datensammlungen. Verfahren wie Singulärwertzerlegung, Gaußsche Mischverteilungsmodelle und das Erstellen von Regeln mit Sequential Covering sind in beiden Produkten verfügbar.

Das Geheimnis beim Extrahieren wertvoller Informationen aus Big Data ist letztendlich die Verwendung der effizientesten und leistungsstärksten Analysealgorithmen für die jeweilige Aufgabe, in Verbindung mit umfassender und intuitiver Datenverwaltung, Datenexploration, Visualisierung und Modellentwicklung. Alles im Rahmen einer durchgängigen Analyseplattform.

Tatsächlich steht eine kurze Amortisierungszeit nicht nur für die schnelle, automatisierte Performance Ihres Modells, sondern auch für die Zeit, die nicht mit dem Verschieben von Daten zwischen den Plattformen verbracht wird. Ausgedehnte, verteilte Analysetechniken, die sich umfassend die parallelisierte Verarbeitung in Verbindung mit Hadoop sowie allen großen Datenbanken zunutze machen, erlauben es Unternehmen mit Big Data-Problemen, schnell alle Schritte des Modellierprozesses zu durchlaufen – ohne Daten zu bewegen. Diese Form der Hochleistungsplattform für Big Data Analytics ermöglicht Unternehmen die Automatisierung des gesamten Analyselebenszyklus – nicht nur der Analytical-Modeling-Algorithmen.

1 Thomas H. Davenport, The Wall Street Journal, September 11, 2013. Source: http://stream.wsj.com/story/latest-headlines/SS-2-63399/SS-2-324308/

Wünschen Sie weitere Informationen?

Sie erreichen die SAS-Experten unter +49 6221 415-123 (Deutschland) oder per E-Mail an info@ger.sas.com.