Data Mining

Bisher unbekannte Trends ans Licht bringen und zukünftige Ergebnisse prognostizieren

Wo werden Forscher nach neuen Erkenntnissen suchen, wenn es auf der Erde nichts mehr gibt, das noch nicht entdeckt wurde? Wenn selbst weite Teile des Kosmos vermessen und kartiert sind? Wo kann man dann noch etwas Unbekanntes entdecken? Wo kann man Reichtümern begegnen, die nie zuvor jemand zu Gesicht bekam? Und wo kann man Entdeckungen machen, die Ihrem Unternehmen zu Erfolg verhelfen?

Die Antwort? Ihre Daten. Mithilfe von Data Mining können Sie bisher verborgene Erkenntnisse ans Licht bringen.

Was ist Data Mining?

Einige der größten Entdecker unserer Zeit sind Data Miner. Sie nutzen Data Mining und prädiktive Analysen, um bisher unbekannte Muster zu entdecken und Prognosen für die Zukunft zu treffen. Die bedeutendsten und am wenigsten erwarteten Ergebnisse können unter Umständen die gesamte Strategie eines Unternehmens verändern.

Wie ist das möglich? Data Mining erkennt Muster in einem Beispieldatensatz und sucht dann nach demselben Muster in einer größeren Datenmenge. Zu guter Letzt wird dann prädiktive Modellierung angewendet, um Ergebnisse zu prognostizieren.

Gängige Data Mining-Techniken:

  • deskriptive Modellierung. Deskriptive Modelle verwenden Muster und Beziehungen, um Elemente in Gruppen zu klassifizieren. Diese Modelle unterstützen die Entwicklung von prädiktiven Modellen.
  • prädiktive Modellierung. Prädiktive Modelle analysieren Muster und Performance-Werte aus der Vergangenheit, um die Wahrscheinlichkeit eines gewünschten Ergebnisses vorherzusagen. Beispiele für prädiktive Modellierung sind Tarifgestaltung bei Versicherungen und Kreditprüfungen bei Banken.
Learning from data is extremely powerful, and its use is transforming business decision making in multiple industries at an accelerating pace, saving money and even lives. It's an exciting time to be a data miner! To be excellent at the work, we need to listen well to transform a real-world challenge into a close, but solvable, problem.

John Elder
Founder and President, Elder Research Inc.

The process of digging through data to discover hidden connections and predict future trends has a long history. Sometimes referred to as "knowledge discovery in databases," the term "data mining" wasn’t coined until the 1990s. But its foundation comprises three intertwined scientific disciplines: statistics (the numeric study of data relationships), artificial intelligence (human-like intelligence displayed by software and/or machines) and machine learning (algorithms that can learn from data to make predictions). What was old is new again, as data mining technology keeps evolving to keep pace with the limitless potential of big data and affordable computing power.

Over the last decade, advances in processing power and speed have enabled us to move beyond manual, tedious and time-consuming practices to quick, easy and automated data analysis. The more complex the data sets collected, the more potential there is to uncover relevant insights. Retailers, banks, manufacturers, telecommunications providers and insurers, among others, are using data mining to discover relationships among everything from pricing, promotions and demographics to how the economy, risk, competition and social media are affecting their business models, revenues, operations and customer relationships.

Analytics Insights

Analytics Insights

Analytics macht erfolgreich: Verlässliche Erkenntnisse. Neue Potenziale. Schnelleres Agieren. Lernen Sie Methoden, Best Practices und Vordenker kennen.

Mehr zu Data Mining


Data mining terminology, tools and techniques

Data mining, as a composite discipline, represents a variety of methods or techniques used in different analytic capabilities that address a gamut of organizational needs, ask different types of questions and use varying levels of human input or rules to arrive at a decision.

Descriptive modeling

Descriptive modeling uncovers shared similarities or groupings in historical data to determine reasons behind success or failure, such as categorizing customers by product preferences or sentiment. Sample techniques include:

  • Clustering – grouping similar records together.
  • Anomaly detection – identifying multidimensional outliers.
  • Association rule learning – detecting relationships between records.
  • Principal component analysis – detecting relationships between variables.
  • Affinity grouping – grouping people with common interests or similar goals (e.g., people who buy X often buy Y and possibly Z).

Predictive modeling

Predictive modeling goes deeper to classify events in the future or estimate unknown outcomes – for example, using credit scoring to determine an individual's likelihood of repaying a loan. Predictive modeling also helps uncover insights for things like customer churn, campaign response or credit defaults. Sample techniques include:

  • Regression – a measure of the strength of the relationship between one dependent variable and a series of independent variables.
  • Neural networks – computer programs that detect patterns, make predictions and learn).
  • Decision trees – tree-shaped diagrams in which each branch represents a probable occurrence.
  • Support vector machines – supervised learning models with associated learning algorithms.
The most important part of any data mining project is defining the problem clearly. No single model tells the complete story. There is no rule that says when you've exhausted the data. [There are diminishing returns, so ask] How much value or money can I bring to the company if I continue?

Dean Abbott
President of Abbott Analytics

Prescriptive modeling

Prescriptive modeling looks at internal and external variables and constraints to recommend one or more courses of action – for example, determining the best marketing offer to send to each customer. Sample techniques include:

  • Predictive analytics plus rules – developing if/then rules from patterns and predicting outcomes.
  • Marketing optimization – simulating the most advantageous media mix in real time for the highest possible ROI.

With the growth in unstructured data from the web, comment fields, books, email, PDFs, audio and other text sources, the adoption of text mining as a related discipline to data mining has also grown significantly. You need the ability to successfully parse, filter and transform unstructured data in order to include it in predictive models for improved prediction accuracy.

In the end, you should not look at data mining as a separate, standalone entity because pre-processing (data preparation, data exploration) and post-processing (model validation, scoring, model performance monitoring) are equally essential.

Data Mining-Beispiele

Erfahren Sie, wie Sie Data Mining nutzen können, um Trends, Muster und Beziehungen zu erkennen, und wie Sie gleichzeitig zukünftige Ergebnisse mithilfe prädiktiver Analysen vorhersagen können.

Jeder verfügt über Daten, die sich analysieren lassen. Und jede Branche kann von Data Mining profitieren. Es gibt in jeder Branche zahlreiche Anwendungsmöglichkeiten für Data Mining-Methoden – von der Segmentierung und Zielgruppenansprache über Betrugserkennung bis hin zu Risikobewertungen für Kredite.

Beispiele für gängige branchenübergreifende Anwendungen für Data Mining:

  • Profilierung und Segmentierung – Vorhersage von Kundenverhalten und -anforderungen nach Segment
  • Lifetime Value – Vorhersage von zukünftigen Werten, einschließlich Marge und Bindung
  • Bonitätsprüfung – Vorhersage der Kreditwürdigkeit neuer und bestehender Kunden
  • Warenkorbanalysen – Vorhersage, welche Produkte wahrscheinlich gemeinsam gekauft werden
  • Wartung von Maschinen und Anlagen – Vorhersage der tatsächlichen Gründe für Anlagenausfälle oder Betriebsstörungen
  • Gesundheitsmanagement – Vorhersage, für welche Patienten das Risiko einer vermeidbaren chronischen Krankheit besteht
  • Betrugsmanagement – Vorhersage unbekannter Betrugsfälle und zukünftiger Risiken
  • Wirkstoffforschung – Vorhersage von Arzneimittelkomponenten, die die gewünschte Wirkung erzielen

Data mining uses and real-world examples


In an overloaded market where competition is tight, the answers are often within your consumer data. The multimedia company Sanoma uses analytic models to make sense of millions of transactions a week, predict customer behavior and offer highly targeted and relevant campaigns.


With analytic know-how, insurance companies can solve complex problems concerning fraud, compliance, risk management and customer attrition. By using SAS to price products in its personal and commercial businesses, OneBeacon Insurance Group improved its loss ratio by two to four points and reduced the time it took to build models.


With unified, data-driven views of student progress, educators can predict student performance before they set foot in the classroom – and develop intervention strategies to keep them on course. More than 4,000 teachers and 350 administrators in the Plano Independent School District can quickly access student data and predict achievement. Many of the district's schools are in the 90th percentile for performance.


Aligning supply plans with demand forecasts is essential, as is early detection of problems, quality assurance and investment in brand equity. Manufacturers can predict wear of production assets and anticipate maintenance, which can maximize uptime and keep the production line on schedule.

Financial Services

Automated algorithms help banks get a better view of market risks, detect fraud faster, manage regulatory compliance obligations and get optimal returns on their marketing investments. HSBC has used data mining techniques to significantly lower the incidence of fraud across tens of millions of debit and credit card accounts.


Large customer databases hold hidden insights that can help you improve customer relationships, optimize marketing campaigns and forecast sales. Staples runs nearly 1,500 multichannel campaigns annually based on 25 million customer records. Data analysis of that campaign generation showed a 137 percent rate of return.


Armed with the right data, agencies can make faster decisions to keep citizens safe, reduce the burden that fraud is putting on government programs and tune in to public sentiment. The UK’s HM Revenue & Customs needed a data analytics solution to help identify significant tax evasion and fraud. Analytics helped the agency locate billions in additional tax revenue.


Predicting outages before they occur, managing pricing volatility and protecting market share are just some of the benefits of harnessing the power of big data. Automated marketing campaigns enabled EDP España to achieve a customer recovery rate of more than 80 percent, electricity customer loyalty of 95 percent and 80 percent loyalty among gas customers.

Health Care

With big data analytics, health insurers can reduce fraud claims, hospital care providers can improve patient outcomes, and patients can receive safer, more affordable care. Blue Cross and Blue Shield of North Carolina used predictive models to determine the potential for at-risk patient readmission so it could engage more with patients before discharge. The data model correctly beat chance by 400 percent in identifying those patients.

Einer unserer Kunden benötigte fünfeinhalb Stunden, um ein Zuordnungsmodell zu erstellen. Dank High-Performance Data Mining schafft er das nun in drei Minuten. Außerdem konnten wir die Leistung in etwa verdoppeln. Das bedeutet für diesen Kunden einen positiven Effekt von mehreren Millionen Dollar.

Wayne Thompson
Analytics Product Manager, SAS

Perspective: HP

Each year, HP conducts approximately 2.5 billion interactions via customer calls, website visits, emails and chat sessions, and has even more touchpoints through retail partners. The result is a 900TB data warehouse with 360 million customer records, growing by millions each month. HP’s goal was clear: find meaningful value in all that data, and achieve a 360-degree view of its customers to be more responsive and competitive.

Savings: With powerful data mining analytics, HP was able to accurately score more than 100 million customers in seconds to target its marketing and service efforts. As a result, HP has seen a 20 percent incremental ROI across campaigns. Orders shipped have increased by 50 percent in three years, and the overall operating profit of the store has increased by more than 50 percent.

Read the complete story about HP

Der Weg zu erfolgreichem Data Mining

Entdecker nutzen viele verschiedene Ansätze, um wertvolle Informationen in ihren Daten aufzuspüren. In der Regel ist Data Mining Teil eines umfassenderen Analyselebenszyklus, der Datenexploration, Modellerstellung, Modellbereitstellung und weitere Schritte umfasst. Der Erfolg jedes Data Mining-Projekts hängt entscheidend von der Definition des Geschäftsproblems ab. Sobald das Problem definiert wurde, empfehlen wir einen Data Mining-Prozess in fünf Schritten, den unsere Kunden erfolgreich umsetzen können:

  • Testen Sie die Daten, indem Sie einen Zieldatensatz erstellen, der groß genug ist, um entscheidende Informationen zu erhalten.
  • Untersuchen Sie die Daten, indem Sie nach erwarteten Beziehungen und nicht erwarteten Trends und Anomalien suchen, um einen umfassenderen Überblick und eine umfassendere Vorstellung zu bekommen.
  • Verändern Sie die Daten, indem Sie die Variablen erstellen, auswählen und transformieren, um sich auf den Auswahlprozess Ihres Modells zu konzentrieren.
  • Modellieren Sie die Daten mithilfe von Analyse-Tools, um nach einer Kombination aus Daten zu suchen, die das gewünschte Ergebnis zuverlässig prognostiziert.
  • Bewerten Sie die Daten und Modelle, indem Sie die Brauchbarkeit und die Zuverlässigkeit der Ergebnisse des Data Mining-Prozesses bewerten.

Teil der Best Practices für Data Mining ist der Vergleich verschiedener Analysetechniken, um festzustellen, welche das beste Modell und somit die beste Vorhersage bietet. Einige dieser Modellierungstechniken umfassen Entscheidungsbäume, neurale Netzwerke, Gradient Boosting, logistische Regressionen, Memory-Based Reasoning und Regeleinführung. Auch in dem wachsenden Bereich des maschinellen Lernens spielt Data Mining eine Rolle. SAS® Enterprise Miner™ wurde speziell für diese und viele weitere Techniken entwickelt.

Dokumente zum Download

Content is loading


Blogbeiträge zum Thema Data Mining

Customer Success

Gute Statistik vs. Böses Data Mining?

Während der Begriff Statistik zumindest nicht negativ besetzt ist, hat „Data Mining“ ein schlechtes Image. Das liegt häufig an der Unkenntnis dessen, was damit überhaupt gemeint ist. SAS-Experte Stefan Ahrens klärt auf.

Jetzt weiterlesen

SAS Lösungen für das Data Mining

Das sollten Sie kennen!

Big Data Insights

Big Data

Riesige Datenmengen sinnvoll nutzen: für mehr Effizienz und geringere Risiken. Erfahren Sie alles über Herausforderungen, Technologien und Vorgehensweisen.

Fraud & Risk Insights

Risk & Fraud

Risiken besser verstehen. Chancen schneller nutzen: Experten informieren über neueste Entwicklungen im Risikomanagement und in der Betrugserkennung.

Marketing Insights


Marketing braucht ständig neue Strategien: Bleiben Sie auf dem Laufenden über moderne Kundenbeziehungen, neue Medien und innovative Kommunikation.

Back to Top