Data Mining

Was ist das und was man darüber wissen sollte

Data mining is the process of finding anomalies, patterns and correlations within large data sets to predict outcomes. Using a broad range of techniques, you can use this information to increase revenues, cut costs, improve customer relationships, reduce risks and more.

Data Mining History & Current Advances

The process of digging through data to discover hidden connections and predict future trends has a long history. Sometimes referred to as "knowledge discovery in databases," the term "data mining" wasn’t coined until the 1990s. But its foundation comprises three intertwined scientific disciplines: statistics (the numeric study of data relationships), artificial intelligence (human-like intelligence displayed by software and/or machines) and machine learning (algorithms that can learn from data to make predictions). What was old is new again, as data mining technology keeps evolving to keep pace with the limitless potential of big data and affordable computing power.

Over the last decade, advances in processing power and speed have enabled us to move beyond manual, tedious and time-consuming practices to quick, easy and automated data analysis. The more complex the data sets collected, the more potential there is to uncover relevant insights. Retailers, banks, manufacturers, telecommunications providers and insurers, among others, are using data mining to discover relationships among everything from price optimization, promotions and demographics to how the economy, risk, competition and social media are affecting their business models, revenues, operations and customer relationships.


Why is data mining important?

So why is data mining important? You’ve seen the staggering numbers – the volume of data produced is doubling every two years. Unstructured data alone makes up 90 percent of the digital universe. But more information does not necessarily mean more knowledge.

Data mining allows you to:

  • Sift through all the chaotic and repetitive noise in your data.
  • Understand what is relevant and then make good use of that information to assess likely outcomes.
  • Accelerate the pace of making informed decisions.

Learn more about data mining techniques in Data Mining From A to Z, a paper that shows how organizations can use predictive analytics and data mining to reveal new insights from data. 

Data Mining heute

Data Mining ist auf dem Gebiet der Analytics von fundamentaler Bedeutung. Im Rahmen des Data Mining werden Modelle entwickelt, die Zusammenhänge zwischen Millionen und Abermillionen von Datensätzen aufdecken können. Lesen Sie selbst, wie Data Mining die Welt von heute prägt.

White Paper

Data Mining in der Öl- und Gasindustrie entschlüsseln

Hier erfahren Sie, wie Data Mining – ebenso wie Predictive Modelling und Echtzeit-Analytics – in der Öl- und Gasindustrie genutzt werden. Das Whitepaper behandelt praktische Herangehensweisen, Workflows und Techniken, die benutzt werden.

Zusammenfassung lesen

Die Schnittstelle von Big Data und Data Mining

Jared Dean, Data Mining-Experte, erläutert in seinem Buch über Data Mining, wie man mit Hochleistungsrechnern und Advanced Analytics größtmöglichen Nutzen aus Analytics-Programmen zieht.

Zusammenfassung lesen


Magic Quadrant für Data Sciene Plattformen

SAS behauptet bereits länger als jedes andere Unternehmen seine Führungsposition in der achtjährigen Geschichte des Gartner Magic Quadranten für Data Science und Machine Learning Plattformen.

Bericht lesen

Heavy Reading: Advanced Predictive Network Analytics

In diesem Bericht erfahren Sie, wie Sie mithilfe von Predictive Analytics zur Evaluierung der Netzwerkleistung ein Netzwerk sowie seine Kapazität optimieren und darüber hinaus ein zielgruppengerechteres Marketing realisieren können.

Vollständigen Bericht abrufen


Data Mining-Software

Data Mining-Software von SAS nutzt bewährte, hochmoderne Algorithmen, mit denen Sie selbst die größten Herausforderungen bewältigen können.

Weitere Informationen über die Data Mining-Software von SAS

Who's using it?

Data mining is at the heart of analytics efforts across a variety of industries and disciplines.

Telecom, Media & Technology

In an overloaded market where competition is tight, the answers are often within your consumer data. Telecom, media and technology companies can use analytic models to make sense of mountains of customers data, helping them predict customer behavior and offer highly targeted and relevant campaigns.


With analytic know-how, insurance companies can solve complex problems concerning fraud, compliance, risk management and customer attrition. Companies have used data mining techniques to price products more effectively across business lines and find new ways to offer competitive products to their existing customer base.


With unified, data-driven views of student progress, educators can predict student performance before they set foot in the classroom – and develop intervention strategies to keep them on course. Data mining helps educators access student data, predict achievement levels and pinpoint students or groups of students in need of extra attention.


Aligning supply plans with demand forecasts is essential, as is early detection of problems, quality assurance and investment in brand equity. Manufacturers can predict wear of production assets and anticipate maintenance, which can maximize uptime and keep the production line on schedule.


Automated algorithms help banks understand their customer base as well as the billions of transactions at the heart of the financial system. Data mining helps financial services companies get a better view of market risks, detect fraud faster, manage regulatory compliance obligations and get optimal returns on their marketing investments.


Large customer databases hold hidden customer insight that can help you improve relationships, optimize marketing campaigns and forecast sales. Through more accurate data models, retail companies can offer more targeted campaigns – and find the offer that makes the biggest impact on the customer.

When [data mining and] predictive analytics are done right, the analyses aren’t a means to a predictive end; rather, the desired predictions become a means to analytical insight and discovery. We do a better job  of analyzing what we really need to analyze and predicting what we really want to predict.

Michael Schrage in Predictive Analytics in Practice , a Harvard Business Review Insight Center Report


Data Mining-Software

Die Data Mining-Software von SAS hilft Ihnen mit bewährten, hochmodernen Algorithmen bei der Bewältigung Ihrer größten Herausforderungen.

Weitere Informationen über die Data Mining-Software von SAS

How It Works

Data mining, as a composite discipline, represents a variety of methods or techniques used in different analytic capabilities that address a gamut of organizational needs, ask different types of questions and use varying levels of human input or rules to arrive at a decision.


Descriptive Modeling: It uncovers shared similarities or groupings in historical data to determine reasons behind success or failure, such as categorizing customers by product preferences or sentiment. Sample techniques include:

Grouping similar records together.
Anomaly detection
Identifying multidimensional outliers.
Association rule learning
Detecting relationships between records.
Principal component analysis
Detecting relationships between variables.
Affinity grouping
Grouping people with common interests or similar goals (e.g., people who buy X often buy Y and possibly Z).


Predictive Modelling: Diese Modellierungsverfahren geht stärker in die Tiefe. Es dient der Klassifikation künftiger Ereignisse oder der Einschätzung unbekannter Ergebnisse. Ein Beispiel dafür ist das Credit Scoring, mit dem die Wahrscheinlichkeit ermittelt wird, dass eine Person einen Kredit ordnungsgemäß abbezahlt. Predictive Modelling hilft auch bei der Erkennung von Faktoren wie Kundenfluktuation, Reaktion auf Kampagnen oder Kreditausfälle. Verfahren sind beispielsweise:

Ein Messverfahren für die Beziehungsstärke zwischen einer abhängigen Variablen und einer Reihe unabhängiger Variablen
Neurale Netzwerke
Lernfähige Computerprogramme für Mustererkennung und Prognosen
Diagramme mit einer Baumstruktur, bei der jeder Zweig für ein mögliches Ereignis steht
Support Vector Machines (SVMs)
Überwachte Lernmodelle mit zugehörigen Lernalgorithmen

Prescriptive Modelling
: Die wachsenden Mengen unstrukturierter Daten aus dem Internet, aus Kommentarfeldern, Büchern, E-Mails, PDF-Dateien, Audio- und anderen Textquellen verhelfen dem Text Mining als verwandter Disziplin des Data Mining zu steigender Bedeutung. Denn man muss in der Lage sein, unstrukturierte Daten erfolgreich zu analysieren, zu filtern und zu transformieren, um sie in Vorhersagemodellen für genauere Prognosen nutzen zu können.

Letztendlich sollte man Data Mining nicht als separate, eigenständige Technik betrachten, da Vorbereitung (Datenvorbereitung, Data Exploration) und Nachbereitung (Modellprüfung, Scoring, Modellleistungsüberwachung) gleichermaßen unverzichtbar sind. Prescriptive Modelling generiert auf der Basis interner und externer Variablen und Beschränkungen eine oder mehrere Handlungsempfehlungen – beispielsweise das jeweils beste individuelle Marketing-Angebot für jeden Kunden. Verfahren sind beispielsweise:

Predictive Analytics plus Regeln
Entwicklung von Wenn-dann-Regeln auf der Grundlage von Mustern sowie Vorhersage der Ergebnisse
Marketing Optimization
Simulation des vorteilhaftesten Medienmix in Echtzeit für den höchstmöglichen ROI

Back to Top