support clients /

Le Data Mining, l’analyse decisionnelle et SAS

Le Data Mining appelé aussi « Knowledge Discovery in Databases » ou « Extraction de Connaissances à partir des Données » s'appuie sur la Statistique pour découvrir des relations entre les diverses informations disponibles dans des bases de données volumineuses.
Ses domaines d’applications industrielles ou opérationnelles commencent par l’exploration des données et vont jusqu’à la prédiction. Ils permettent de résoudre des problématiques diverses – comme, par exemple :

  • trouver une association entre différents produits dans des téraoctets de données de consommation courante,
  • prédire le comportement d'achat des clients,
  • fournir la meilleure offre, au bon moment au client via son canal privilégié (CRM).

L'objet du data mining est l'extraction d'un savoir ou d'une connaissance à partir de volumes importants de données, par des méthodes automatiques ou semi-automatiques en adressant les questions suivantes :

  1. Comment extraire, d'une masse importante de données, des informations exploitables par l'entreprise comme par exemple : analyser et comprendre les informations économiques, géographiques et comportementales individualisées ?
  2. Comment prendre en compte les contraintes de :
  • Volumétrie de données :
    - Plus de données (plusieurs millions d'individus, milliers de variables, nombreuses variables non numériques, parfois textuelles, population constamment évolutive)
    - Plus de détails
    - Une segmentation client de plus en plus difficile à établir
  • Rapidité de traitement (parfois en temps réel)
    - Flux de données entrant et sortant de plus en plus importants (incluant des fichiers externes d'informations, données imparfaites)
    - Des erreurs de saisie, de codification, des valeurs manquantes, aberrantes
  • Business : Budget, métier ou/et marketing.

Définition du Data Mining

Le data mining est un ensemble de processus d'études, statistiques en général, qui visent à découvrir des interactions et des phénomènes cachés (au sens de "non connus par les initiateurs de l'étude") dans un volume important de données. Ces méthodes rassemblées sous le nom de data mining sont assorties d'une méthodologie circulaire pour leur mise en œuvre : c'est le "cercle vertueux" du data mining. 
Environnement typique datamining

Les domaines d'application du Data Mining

Les domaines d'application du data mining sont très variés : il s'agit de la quasi-intégralité des domaines où la Statistique a droit de cité. Ainsi l'industrie pharmaceutique, le marketing, la gestion des ressources humaines, la chimie, la sociologie, l'économétrie, l'assurance, la banque, le crédit, la grande distribution...
Quelques exemples d'applications concrètes :

- meilleure compréhension de la relation au client (évaluation des causes et seuils de satisfaction/insatisfaction)  avec, par exemple : SAS text Miner (pour analyser les lettres de réclamation)

- prédictions du comportement des consommateurs (anticipation des besoins futurs d'un client en fonction de ses achats actuels ou de son cycle de vie familial),           

- diminution des coûts d'acquisition des clients (offre adaptée en fonction des différentes combinaisons possibles des variables personnelles du prospect),

- évaluation de la valeur actualisée d'un client (actualisation de l'ensemble des profits attendus d'un client suivant son profil)

- analyse e-marketing du comportement client.

Les différentes techniques de data mining :
Il existe deux approches dans le domaine du Data Mining :

Apprentissage non supervisé :
Il s’agit ici de techniques dites descriptives qui :

  1. Mettent en évidence des informations présentes mais cachées par le volume des données, par exemple, la création de segments clients, les recherches d'associations de produits à partir de l'analyse des tickets de caisses, la distribution de coupons
  2. Réduisent, résument, synthétisent les données
  3. N'impliquent pas de variable « cible » à prédire.

Apprentissage supervisé :
 Ce sont des techniques prédictives qui :

  1. Visent à extrapoler de nouvelles informations à partir des informations présentes (scoring, prévisions des ventes, de trafic …)
  2. Expliquent les données
  3. Impliquent la connaissance d’une ou plusieurs variables « cible » à prédire  par exemple : prévoir si le client va acheter ou non un type de produits, la probabilité que le client achète tel type de produits via un site commercial internet

Nos outils et nos solutions SAS pour le Data Mining

SAS dispose d'un panel d'outils et de solutions permettant de répondre aux différentes approches du data mining, allant de l'exploration des données jusqu'à la validation de modèles business complexes permettant des prises de décision business ou métier.
Techniques descriptives

 

Nos outils et nos solutions SAS DataMining

Retrouvez tous nos produits et toutes nos solutions SAS® Data Mining

Virginie BRAIDO
Consultant Support Clients SAS France