Data mining

Présentation et atouts

Le data mining est le processus qui consiste à trouver des anomalies, des modèles et des corrélations dans de grands ensembles de données afin de prévoir les résultats. Grâce à un large éventail de techniques, vous pouvez utiliser ces informations pour augmenter les revenus, réduire les coûts, améliorer la relation client, réduire les risques, etc.

Histoire du data mining et progrès actuels

Le processus consistant à fouiller dans les données pour découvrir des corrélations cachées et prédire les tendances futures ne date pas d'hier. Parfois appelé "découverte de connaissances dans les données", le terme "data mining" n'a été inventé que dans les années 1990. Mais il repose sur trois disciplines scientifiques étroitement liées : les statistiques (l'étude numérique des relations entre les données), l'intelligence artificielle (une intelligence proche de l'intelligence humaine et mise en oeuvre par les logiciels et/ou les machines) et le machine learning (les algorithmes capables d'apprendre à partir des données pour faire des prédictions). Ce qui était dépassé redevient novateur, car la technologie de data mining ne cesse d'évoluer pour s'adapter au potentiel illimité du big data et à une puissance de calcul moins onéreuse.

Au cours des dix dernières années, les progrès en matière de puissance et de vitesse de traitement nous ont permis de passer de pratiques manuelles, fastidieuses et chronophages à une analyse des données rapide, facile et automatisée. Plus les ensembles de données collectées sont complexes, plus le potentiel de découverte d'informations pertinentes est important. Les enseignes, les banques, les industriels, les opérateurs de télécommunications et les assureurs, entre autres, utilisent le data mining pour identifier les relations entre données, de l'optimisation des prix, des promotions et des données démographiques jusqu'à la façon dont l'économie, les risques, la concurrence et les réseaux sociaux affectent leurs modèles d'entreprise, leurs revenus, leurs opérations et leurs relations avec les clients.

 

Quels sont les points forts du data mining ?

Alors pourquoi s'intéresse-t-on au data mining ? Vous connaissez ces chiffres stupéfiants – le volume des données produites double tous les deux ans. Les données non structurées représentent à elles seules 90 % de l'univers numérique. Mais plus d'informations ne se traduit pas forcément par plus de connaissances.

Le data mining vous permet de :

  • Éliminer les bruits chaotiques et répétitifs dans vos données.
  • Comprendre ce qui est pertinent, puis bien utiliser ces informations pour évaluer les résultats probables.
  • Prendre des décisions éclairées plus rapidement.

Découvrez-en plus sur les techniques de data mining dans le document Data Mining de A à Z, qui montre comment les entreprises peuvent utiliser l'analyse prédictive et le data mining pour révéler de nouvelles informations à partir des données. 

Le Data Mining dans le monde d’aujourd’hui

Le data mining est une pierre angulaire de l'analytique, qui vous aide à développer des modèles capables de découvrir des connexions dans des millions ou des milliards d'enregistrements. Découvrez comment le data mining façonne le monde dans lequel nous vivons.

White Paper

Démystifier le data mining dans les opérations pétrolières et gazières

Découvrez comment le data mining – ainsi que la modélisation prédictive et l'analytique en temps réel – sont utilisées dans les opérations pétrolières et gazières. Ce document explore les approches pratiques, les flux de travail et les techniques utilisées.

Lire la synthèse

Le lien entre big data et data mining

L'expert en data mining Jared Dean a écrit un livre sur le data mining. Il explique comment maximiser votre programme analytique en utilisant le calcul haute performance et l'analytique avancée.

Lire la synthèse

 

Data mining software

Data mining software from SAS uses proven, cutting-edge algorithms designed to help you solve the biggest challenges.

Learn more about data mining software from SAS

Utilisation

Le data mining est au cœur des efforts analytiques dans bon nombre d'industries et de disciplines.

Télécommunications, médias & Technologie

Dans un marché saturé où la concurrence est élevée, les réponses se trouvent souvent dans les données de vos consommateurs. Les entreprises des télécommunications, médias et technologies peuvent utiliser des modèles analytiques pour donner du sens à d'immenses volumes de données client, afin de prédire leur comportement et de proposer des campagnes ciblées et pertinentes.

Assurance

Grâce au savoir-faire analytique, les compagnies d'assurance peuvent résoudre des problèmes complexes relatifs à la fraude, la conformité, la gestion des risques et l'attrition client. Les assureurs ont utilisé des techniques de data mining pour définir leurs prix plus efficacement dans les différentes branches d'activité et trouver de nouvelles façons de proposer des offres compétitives à leur clientèle existante.

Enseignement

Grâce à des vues unifiées et pilotées par les données qui montrent les progrès des élèves, les éducateurs peuvent prédire les performances des élèves avant même qu'ils ne mettent un pied dans la salle de classe – et développer des stratégies d'intervention pour les maintenir sur la bonne voie. Le data mining permet aux éducateurs d'accéder aux données des élèves, de prévoir les niveaux de réussite et d'identifier les élèves ou les groupes d'élèves nécessitant une attention particulière.

Manufacturing

L'alignement des plans d'approvisionnement sur la prévision de la demande est essentiel, tout comme la détection anticipée des problèmes, l'assurance qualité et l'investissement dans le capital de la marque. Les industriels peuvent prédire l'usure des équipements de production et anticiper la maintenance, ce qui permet de maximiser le temps de fonctionnement et de maintenir la chaîne de production dans les délais.

Banque

Les algorithmes automatisés aident les banques à comprendre leur clientèle ainsi que les milliards de transactions au cœur du système financier. Le data mining aide les sociétés de services financiers à avoir une meilleure vision des risques du marché, à détecter plus rapidement les fraudes, à gérer les obligations de conformité réglementaire et à obtenir des retours optimaux sur leurs investissements marketing.

Retail & Biens de consommation

Les grandes bases de données clients recèlent des informations cachées sur les clients qui peuvent vous aider à améliorer la relation client, à optimiser les campagnes marketing et à prévoir les ventes. Grâce à des modèles de données plus précis, les enseignes peuvent proposer des campagnes plus ciblées – et définir l'offre qui aura le plus d'impact sur le client.

 

Data mining software

SAS data mining software uses proven, cutting-edge algorithms designed to help you solve your biggest challenges.

Learn more about data mining software from SAS

Comment ça marche

Le data mining, en tant que discipline composite, représente une variété de méthodes ou de techniques utilisées dans différentes fonctionnalités analytiques qui répondent à toute une gamme de besoins organisationnels, posent différents types de questions et utilisent des niveaux variables de contribution humaine ou de règles pour aboutir à une décision.

 

Modélisation descriptive : Elle permet de découvrir des similitudes ou des regroupements dans les données historiques afin de déterminer les raisons du succès ou de l'échec, par exemple en classant les clients par préférences de produits ou par sentiment. Voici quelques exemples de techniques :

Clusterisation
Regroupement d'enregistrements similaires.
Détection d'anomalie
Identification des valeurs multidimensionnelles hors norme .
Apprentissage de règles d'association
Détecter les relations entre les enregistrements.
Analyse en composantes principales
Détection des relations entre les variables.
Groupe d'affinité
Regroupement de personnes ayant des intérêts communs ou des objectifs similaires (par exemple, les personnes qui achètent X achètent souvent Y et éventuellement Z).

 

Modélisation prédictive : Cette modélisation va plus loin pour classer des événements dans le futur ou estimer des résultats non connus – par exemple, évaluer la solvabilité d'un individu pour déterminer la probabilité qu'il rembourse un prêt. La modélisation prédictive permet également d'obtenir des indications sur des éléments tels que la perte de client, la réponse aux campagnes ou les défauts de paiement. Voici quelques exemples de techniques :

Analyse de régression
Mesure de la force de la relation entre une variable dépendante et une série de variables indépendantes.
Réseaux de neurones
Programmes informatiques qui détectent des modèles, font des prédictions et apprennent.
Arbres de décision
Diagrammes en forme d'arbre dans lesquels chaque branche représente une occurrence probable.
Machines à vecteurs de support
Modèles d'apprentissage supervisé avec algorithmes d'apprentissage associés.


Modélisation prescriptive
: Avec la croissance des données non structurées issues du web, des champs de commentaires, des livres, des e-mails, des PDF, des fichiers audio et d'autres sources de texte, l'adoption du text mining comme discipline connexe au data mining a également connu une croissance importante. Vous devez être capable d'analyser, de filtrer et de transformer avec succès les données non structurées afin de les inclure dans des modèles prédictifs pour améliorer la précision des prédictions.

En fin de compte, vous ne devez pas considérer le data mining comme une entité distincte et autonome, car le prétraitement (préparation des données, exploration des données) et le post-traitement (validation du modèle, scoring, suivi des performances du modèle) sont tout aussi essentiels. La modélisation prescriptive examine les variables et les contraintes internes et externes afin de recommander une ou plusieurs lignes d'action – par exemple, déterminer la meilleure offre marketing à envoyer à chaque client. Voici quelques exemples de techniques :

Analyse prédictive et règles
Développer des règles "si/alors" à partir de patterns et prédire les résultats.
Optimisation marketing
Simuler en temps réel le mix média le plus avantageux pour obtenir le meilleur retour sur investissement possible.