Data Mining: che cos'è e perché è importante

Il data mining è il processo di ricerca di anomalie, modelli e correlazioni all'interno di grandi insiemi di dati per prevederne gli esiti. Utilizzando un'ampia gamma di tecniche, è possibile utilizzare queste informazioni per aumentare i ricavi, tagliare i costi, migliorare le relazioni con i clienti, ridurre i rischi e altro ancora.

La storia del Data Mining e le sue attuali evoluzioni

Il processo di estrazione dei dati, utilizzato per scoprire connessioni nascoste e prevedere le tendenze future, ha una lunga storia. A volte indicato come "knowledge discovery in database," il termine "data mining" è stato coniato solo negli anni Novanta. Il suo fondamento comprende tre discipline scientifiche intrecciate: la statistica (lo studio numerico delle relazioni tra i dati), l'intelligenza artificiale (intelligenza di tipo umano visualizzata da software e/o macchine) e il machine learning (o apprendimento automatico, algoritmi che possono imparare dai dati per fare previsioni). Ciò che era vecchio è ora nuovo, poiché la tecnologia di data mining continua ad evolversi per tenere il passo con il potenziale illimitato dei big data e della potenza di calcolo sempre più accessibile.

Nell'ultimo decennio, i progressi in termini di potenza e velocità di elaborazione ci hanno permesso di andare oltre le pratiche manuali, noiose e dispendiose in termini di tempo, per passare a un'analisi dei dati rapida, semplice e automatizzata. Quanto più complessi sono i set di dati raccolti, tanto maggiore è il potenziale per scoprire informazioni rilevanti. Retail, banche, aziende manifatturiere, fornitori di telecomunicazioni e assicuratori, tra gli altri, stanno utilizzando il data mining per scoprire tutte le relazioni contenute nei dati: l'ottimizzazione dei prezzi, le promozioni e come i dati demografici sull'economia, il rischio, la concorrenza e i social media stanno influenzando i loro modelli di business, i ricavi, le operazioni e le relazioni con i clienti.

 

 

Perché il data mining è importante?

Allora perché è importante il data mining? Prendiamo in esame dei numeri sconcertanti: il volume di dati prodotti raddoppia ogni due anni. I dati non strutturati, da soli, costituiscono il 90% dell'universo digitale. Ma più informazioni non significa necessariamente più conoscenza.

Il data mining ti permette di:

  • Setacciare tutte le discrepanze e le ripetizioni presenti nei tuoi dati.
  • Comprendere ciò che è rilevante e poi fare buon uso di tali informazioni per valutare i possibili risultati.
  • Accelerare il processo decisionale informato.

Per saperne di più sulle tecniche di data mining leggi Data Mining dalla A alla Z un documento che mostra come le organizzazioni possono utilizzare l'analisi predittiva e il data mining per rivelare nuove intuizioni dai dati. 

Il Data Mining nel mondo di oggi

Il data mining è una pietra miliare degli analytics che aiuta a sviluppare modelli in grado di scoprire connessioni all'interno di milioni o miliardi di record. Scopri come il data mining sta plasmando il mondo in cui viviamo.

White Paper

Data mining nel settore oil & gas

Esplora come il data mining, così come la modellazione predittiva e l'analisi in tempo reale, sono utilizzati nelle operazioni in ambito oil e gas. Questo documento esplora gli approcci pratici, i flussi di lavoro e le tecniche utilizzate.

Leggi il report

L'intersezione tra big data e data mining

L'esperto di data mining Jared Dean ha scritto un libro in cui spiega come massimizzare le tue attività analitiche utilizzando l'high-performance computing e gli advanced analytics.

Leggi il report

gartner-logo

Magic Quadrant for Data Science Platforms

Gartner nomina SAS leader nel Magic Quadrant for Data Science Platforms, e "top vendor nel mercato della data science in termini di ricavi totali e numero di clienti paganti."

Ottieni il report completo

Lettura impegnativa: Advanced Predictive Network Analytics

Scopri come è possibile ottimizzare la rete utilizzando l'analisi predittiva per valutare le prestazioni della rete e per ottimizzare le funzionalità di marketing mirato.

Ottieni il report completo

 

Software di Data Mining

Il software SAS di data mining utilizza algoritmi collaudati e all'avanguardia, progettati per aiutarti a risolvere le sfide di business più impegnative.

Scopri di più sul software di data mining SAS

Chi lo utilizza?

Il data mining è al centro delle attività di analisi in diversi settori e discipline.

Telecomunicazioni, Media e Tecnologia

In un mercato sovraccarico in cui la concorrenza è serrata, le risposte sono spesso all'interno dei dati dei consumatori. Le aziende di telecomunicazioni e multimediali possono utilizzare modelli analitici per dare un senso alle montagne di dati dei clienti, aiutandole a prevedere il comportamento dei clienti e offrendo campagne altamente mirate e rilevanti.

Assicurazioni

Grazie al know-how analitico, le compagnie assicurative sono in grado di risolvere problemi complessi riguardanti frodi, compliance, risk management e customer attrition. Le assicurazioni hanno utilizzato tecniche di data mining per definire i prezzi dei prodotti assicurativi in modo più efficace per tutte le linee di business e trovare nuovi modi per offrire prodotti competitivi alla loro base clienti.

Education

Con una visione unica e data-driven sui progressi degli studenti, gli educatori possono prevedere le prestazioni degli studenti prima ancora che mettano piede in classe e sviluppare strategie di intervento mirate. Il data mining aiuta gli educatori ad accedere ai dati degli studenti, a prevedere i livelli di rendimento e a individuare gli studenti o i gruppi di studenti che hanno bisogno di ulteriore attenzione.

Manufacturing

L'allineamento dei piani di approvvigionamento alle previsioni della domanda è essenziale, così come l'individuazione precoce dei problemi, la garanzia della qualità e gli investimenti in brand equity. Le aziende possono prevedere l'usura dei mezzi di produzione e anticipare la manutenzione, il che può massimizzare i tempi di attività e mantenere la linea di produzione secondo i tempi previsti.

Banche

Gli algoritmi automatizzati aiutano gli istituti bancari a comprendere la loro base di clienti e i miliardi di transazioni che costituiscono il cuore del sistema finanziario. Il data mining aiuta le società di servizi finanziari ad avere una migliore visione dei rischi di mercato, a rilevare più velocemente le frodi, a gestire gli obblighi di conformità normativa e ad ottenere un rendimento ottimale dei loro investimenti di marketing.

Retail

I database clienti di grandi dimensioni contengono informazioni nascoste che possono aiutarti a migliorare le relazioni, ottimizzare le campagne di marketing e prevedere le vendite. Attraverso modelli di dati più accurati, le aziende di vendita al dettaglio possono offrire campagne più mirate e trovare l'offerta che ha il maggiore impatto sul cliente.

Quando [il data mining e] l'analisi predittiva sono implementati correttamente, le analisi non sono un mezzo per un fine predittivo. Anzi: le previsioni desiderate diventano un mezzo per l'intuizione analitica e la scoperta. Un processo di data mining ci consente di analizzare ciò di cui abbiamo realmente bisogno e di prevedere ciò che vogliamo realmente prevedere.

Michael Schrage in Predictive Analytics in Practice, un report dell'Harvard Business Review Insight Center

 

Software di Data Mining

Il software SAS di data mining utilizza algoritmi collaudati e all'avanguardia, progettati per aiutarti a risolvere le sfide di business più impegnative.

Scopri di più sul software di data mining SAS

Come funziona

Il data mining, in quanto disciplina composita, rappresenta una varietà di metodi o tecniche utilizzate negli analytics che rispondono a una gamma di esigenze organizzative, pongono diversi tipi di domande e utilizzano diversi livelli di input umano o regole per arrivare a una decisione.

 

Modellazione descrittiva: Scopre similitudini o raggruppamenti condivisi nei dati storici per determinare le ragioni del successo o del fallimento, come ad esempio la categorizzazione dei clienti in base alle preferenze di prodotto o al sentimento. Le tecniche di campionamento includono:

Clustering
Raggruppa record simili.
Anomaly detection
Identifica gli outlier multidimensionali.
Apprendimento nelle regole di associazione
Identifica le relazioni tra i record.
Analisi dei componenti principali
Rileva le relazioni tra le variabili.
Raggruppamento delle affinità
Raggruppa persone con interessi comuni o obiettivi simili (ad esempio, chi compra X spesso compra Y ed eventualmente Z).

 

Modellazione predittiva: Questa modellazione va più in profondità per classificare gli eventi nel futuro o per stimare i risultati sconosciuti. Ad esempio con l'utilizzo del credit scoring per determinare la probabilità di un individuo di rimborsare un prestito. La modellazione predittiva aiuta anche a scoprire informazioni di valore in attività come customer churn, risposte alle campagne marketing o inadempimenti creditizi. Le tecniche di esempio includono:

Regressione
Una misura della forza nella relazione tra una variabile dipendente e una serie di variabili indipendenti.
Reti neurali
Programmi informatici che rilevano gli schemi, fanno previsioni e imparano.
Alberi decisionali
Diagrammi ad albero in cui ogni ramo rappresenta un evento probabile.
Support vector machines
Modelli di apprendimento supervisionati con algoritmi di apprendimento associati.


Modellazione prescrittiva
: Con la crescita dei dati non strutturati provenienti dal web, dai campi di commento, dai libri, dalle e-mail, dai PDF, dall'audio e da altre fonti di testo, anche l'adozione del text mining come disciplina correlata al data mining è cresciuta in modo significativo. È necessaria la capacità di analizzare, filtrare e trasformare con successo i dati non strutturati per includerli in modelli predittivi per migliorare l'accuratezza delle previsioni.

Alla fine, non si dovrebbe considerare il data mining come un'entità separata e autonoma, perché il pre-processing (preparazione ed esplorazione dei dati) e il post-processing (convalida del modello, scoring, monitoraggio delle prestazioni del modello) sono ugualmente essenziali. La modellazione prescrittiva guarda alle variabili e ai vincoli interni ed esterni per raccomandare una o più linee d'azione, ad esempio, determinare la migliore offerta di marketing da inviare ad ogni cliente. Le tecniche di campionamento includono:

Analisi predittiva con regole
Sviluppa regole if/then da modelli e ne prevede i risultati.
Marketing Optimization
Simula in tempo reale il media mix più vantaggioso per ottenere il più alto ROI possibile.