Data Mining

Was ist das und was man darüber wissen sollte

Bei Data Mining handelt es sich um einen Prozess, mit dessen Hilfe man Besonderheiten, Strukturen und Wechselbeziehungen innerhalb großer Datensätze erkennen kann und somit in der Lage ist, Zukunftsprognosen zu stellen. Durch Nutzung eines breiten Technologiespektrums können Sie diese Informationen zur Umsatzsteigerung, Kostensenkung, Verbesserung Ihrer Kundenbeziehungen, Risikominimierung und für viele weitere Maßnahmen nutzen.

Data Mining Geschichte & aktuelle Fortschritte

Das Durchsuchen von Daten, um verborgene Zusammenhänge zu entdecken und zukünftige Trends vorherzusagen, hat eine lange Geschichte. Der Begriff "Data Mining", der manchmal auch als " Erkennung von Wissen in Datenbanken" bezeichnet wird, wurde erst in den 1990er Jahren geprägt. Seine Grundlage bilden jedoch drei miteinander verwobene wissenschaftliche Disziplinen: Statistik (die numerische Untersuchung von Datenbeziehungen), künstliche Intelligenz (menschenähnliche Intelligenz, die von Software und/oder Maschinen dargestellt wird) und maschinelles Lernen (Algorithmen, die aus Daten lernen und Vorhersagen treffen können). Was alt war, ist wieder neu, denn die Data-Mining-Technologie entwickelt sich ständig weiter, um mit dem grenzenlosen Potenzial von Big Data und erschwinglicher Rechenleistung Schritt zu halten.

In den letzten zehn Jahren haben wir dank der Fortschritte im Bereich Prozessorleistung -und Geschwindigkeit die Möglichkeit, manuelle, sehr mühsame und zeitaufwändige Verfahren durch schnelle, einfache und automatische Datenanalysen abzulösen. Je komplexer die gesammelten Datensätze sind, desto größer ist die Wahrscheinlichkeit, aussagekräftige und fundierte Schlüsse ziehen zu können.

Der Einzelhandel, Banken, Fertigungsindustrie, Telekommunikationsunternehmen und Versicherungen nutzen Data Mining, um Zusammenhänge zu erkennen, die von der Preisoptimierung über Werbeaktionen und demografische Daten bis hin zu den Auswirkungen von Wirtschaft, Risiken, Wettbewerb und sozialen Medien auf ihre Geschäftsmodelle, Einnahmen, Abläufe und Kundenbeziehungen reichen.

Warum ist Data Mining wichtig?

Warum ist Data Mining also wichtig? Sie haben die schwindelerregenden Zahlen gesehen - die Menge der produzierten Daten verdoppelt sich alle zwei Jahre. Allein die unstrukturierten Daten machen 90 Prozent des digitalen Universums aus. Aber mehr Informationen bedeuten nicht unbedingt mehr Wissen.

Data Mining ermöglicht Ihnen:

  • Das chaotische und sich wiederholende Rauschen in Ihren Daten zu durchforsten
  • Verstehen, was relevant ist, und diese Informationen dann sinnvoll nutzen, um voraussichtliche Ergebnisse zu bewerten
  • Den Entscheidungsprozess zu beschleunigen, um fundierte Geschäftsentscheidungen zu treffen

Erfahren Sie mehr über Data-Mining-Techniken in Data Mining From A to Z, einem Artikel, der zeigt, wie Unternehmen Predictive Analytics und Data Mining einsetzen können, um neue Ergebnisse aus Daten zu gewinnen. 

Data Mining heute

Data Mining ist auf dem Gebiet der Analytics von fundamentaler Bedeutung. Im Rahmen des Data Mining werden Modelle entwickelt, die Zusammenhänge zwischen Millionen und Abermillionen von Datensätzen aufdecken können. Lesen Sie selbst, wie Data Mining die Welt von heute prägt.

White Paper

Data Mining in der Öl- und Gasindustrie entschlüsseln

Hier erfahren Sie, wie Data Mining – ebenso wie Predictive Modelling und Echtzeit-Analytics – in der Öl- und Gasindustrie genutzt werden. Das Whitepaper behandelt praktische Herangehensweisen, Workflows und Techniken, die benutzt werden.

Zusammenfassung lesen

Die Schnittstelle von Big Data und Data Mining

Jared Dean, Data Mining-Experte, erläutert in seinem Buch über Data Mining, wie man mit Hochleistungsrechnern und Advanced Analytics größtmöglichen Nutzen aus Analytics-Programmen zieht.

Zusammenfassung lesen

gartner-logo

Magic Quadrant für Data Sciene Plattformen

SAS behauptet bereits länger als jedes andere Unternehmen seine Führungsposition in der achtjährigen Geschichte des Gartner Magic Quadranten für Data Science und Machine Learning Plattformen.

Bericht lesen

Heavy Reading: Advanced Predictive Network Analytics

In diesem Bericht erfahren Sie, wie Sie mithilfe von Predictive Analytics zur Evaluierung der Netzwerkleistung ein Netzwerk sowie seine Kapazität optimieren und darüber hinaus ein zielgruppengerechteres Marketing realisieren können.

Vollständigen Bericht abrufen

 

Data Mining-Software

Data Mining-Software von SAS nutzt bewährte, hochmoderne Algorithmen, mit denen Sie selbst die größten Herausforderungen bewältigen können.

Weitere Informationen über die Data Mining-Software von SAS

Wer nutzt Data Mining?

Für viele Branchen und Fachbereiche ist Data Mining das Herzstück der Analyseverfahren.

Telekommunikation, Medien und Technologie

In einem vom Wettbewerb geprägten, unüberschaubaren Markt liegen die Antworten oft in Ihren Kundendaten. Telekommunikations-, Medien- und Technologieunternehmen können mit Hilfe von Analysemodellen Unmengen von Kundendaten auswerten, um das Kundenverhalten vorherzusagen und zielgerichtete und passende Angebote anzubieten.

Versicherungswesen

Mit analytischem Know-how können Versicherungsunternehmen komplexe Probleme in Bezug auf Betrug, Einhaltung von Vorschriften, Risikomanagement und Kundenabwanderung lösen. Unternehmen nutzen Data-Mining-Techniken, um die Preise für Produkte in verschiedenen Geschäftsbereichen zu optimieren und neue Wege zu finden, ihrem bestehenden Kundenstamm wettbewerbsfähige Produkte anzubieten.

Bildung

Mit einer einheitlichen, datengestützten Übersicht über die Fortschritte der Schüler können Pädagogen die Leistungen ihrer Schüler, bevor diese überhaupt das Klassenzimmer betreten haben, vorhersagen und somit bereits Interventionsstrategien entwickeln, um die Schüler auf Kurs zu halten.
Mit Hilfe von Data Mining können Pädagogen auf Schülerdaten zugreifen, Leistungsniveaus vorhersagen und Schüler oder Schülergruppen identifizieren, die besondere Aufmerksamkeit benötigen.

Fertigungsindustrie

Die Abstimmung der Beschaffungspläne mit den Bedarfsprognosen ist ebenso wichtig wie frühzeitige Erkennung von Problemen, die Qualitätssicherung und Investitionen in den Markenwert. Hersteller können die Verschleißerscheinungen von Fertigungsanlagen vorhersagen und Wartungsarbeiten berücksichtigen, wodurch die Maschinenlaufzeit maximiert und die Produktionslinie im Zeitplan gehalten werden kann.

Bankwesen

Automatisierte Algorithmen helfen Banken, ihren Kundenstamm sowie die Milliarden von Geschäftsvorgängen im Herzen des Finanzsystems zu verstehen. Data Mining hilft Finanzdienstleistern, einen besseren Überblick über Marktrisiken zu erhalten, Betrugsfälle schneller zu erkennen, die Einhaltung gesetzlicher Vorschriften zu verwalten und eine optimale Rendite für ihre Marketinginvestitionen zu erzielen.

Einzelhandel

Große Kundendatenbanken enthalten wertvolle Informationen über Kunden, die Ihnen helfen können, Beziehungen zu verbessern, Marketingkampagnen zu optimieren und Umsatzprognosen zu erstellen. Durch genauere Datenmodelle können Einzelhandelsunternehmen gezieltere Aktionen anbieten - und das Angebot finden, das die größte Wirkung auf den Kunden hat.

When [data mining and] predictive analytics are done right, the analyses aren’t a means to a predictive end; rather, the desired predictions become a means to analytical insight and discovery. We do a better job  of analyzing what we really need to analyze and predicting what we really want to predict.

Michael Schrage in Predictive Analytics in Practice , a Harvard Business Review Insight Center Report

 

Data Mining-Software

Die Data Mining-Software von SAS hilft Ihnen mit bewährten, hochmodernen Algorithmen bei der Bewältigung Ihrer größten Herausforderungen.

Weitere Informationen über die Data Mining-Software von SAS

Wie funktioniert Data Mining

Als eine Mischung unterschiedlicher Technologien, steht Data Mining für eine Vielzahl von Methoden oder Techniken, die in verschiedenen Analysemöglichkeiten zum Einsatz kommen, die eine Reihe von organisatorischen Anforderungen abdecken, verschiedene Arten von Fragen stellen und in unterschiedlichem Maße menschliche Eingaben oder Regeln verwenden, um eine Entscheidungsgrundlage zu schaffen.

 

Descriptive Modeling: Dieses Verfahren deckt Gemeinsamkeiten oder Zusammenhänge in der Datensammlung auf, um Ursachen für Erfolg bzw. Misserfolg zu ermitteln, z. B. eine Zuordnung nach Produktvorlieben- oder Zufriedenheit bei Kunden. Folgende Methoden sind als Beispiele zu nennen:

Clustering
Gruppierung ähnlicher Datensätze
Anomalie-Erkennung
Identifizierung mehrdimensionaler Ausreißer
Erlernen von Assoziationsregeln
Erkennen von Beziehungen zwischen Datensätzen
Analyse der Hauptkomponenten
Erkennen von Beziehungen zwischen Variablen
Eingruppierung nach Affinitäten
Eingruppierung von Personen mit gemeinsamen Interessen oder ähnlichen Zielen (z. B. Personen, die X kaufen, kaufen häufig Y und möglicherweise Z)

 

Predictive Modelling: Diese Modellierungsverfahren geht stärker in die Tiefe. Es dient der Klassifikation künftiger Ereignisse oder der Einschätzung unbekannter Ergebnisse. Ein Beispiel dafür ist das Credit Scoring, mit dem die Wahrscheinlichkeit ermittelt wird, dass eine Person einen Kredit ordnungsgemäß abbezahlt. Predictive Modelling hilft auch bei der Erkennung von Faktoren wie Kundenfluktuation, Reaktion auf Kampagnen oder Kreditausfälle. Verfahren sind beispielsweise:

Regressionverfahren
Ein Messverfahren für die Beziehungsstärke zwischen einer abhängigen Variablen und einer Reihe unabhängiger Variablen
Neurale Netzwerke
Lernfähige Computerprogramme für Mustererkennung und Prognosen
Entscheidungsbäume
Diagramme mit einer Baumstruktur, bei der jeder Zweig für ein mögliches Ereignis steht
Support Vector Machines (SVMs)
Überwachte Lernmodelle mit zugehörigen Lernalgorithmen


Prescriptive Modelling
: Die wachsenden Mengen unstrukturierter Daten aus dem Internet, aus Kommentarfeldern, Büchern, E-Mails, PDF-Dateien, Audio- und anderen Textquellen verhelfen dem Text Mining als verwandter Disziplin des Data Mining zu steigender Bedeutung. Denn man muss in der Lage sein, unstrukturierte Daten erfolgreich zu analysieren, zu filtern und zu transformieren, um sie in Vorhersagemodellen für genauere Prognosen nutzen zu können.

Letztendlich sollte man Data Mining nicht als separate, eigenständige Technik betrachten, da Vorbereitung (Datenvorbereitung, Data Exploration) und Nachbereitung (Modellprüfung, Scoring, Modellleistungsüberwachung) gleichermaßen unverzichtbar sind. Prescriptive Modelling generiert auf der Basis interner und externer Variablen und Beschränkungen eine oder mehrere Handlungsempfehlungen – beispielsweise das jeweils beste individuelle Marketing-Angebot für jeden Kunden. Verfahren sind beispielsweise:

Predictive Analytics plus Regeln
Entwicklung von Wenn-dann-Regeln auf der Grundlage von Mustern sowie Vorhersage der Ergebnisse
Marketing Optimization
Simulation des vorteilhaftesten Medienmix in Echtzeit für den höchstmöglichen ROI

Back to Top