Analisi Predittiva

Che cos’è e perché è importante

L'analisi predittiva consiste nell’utilizzare dati, algoritmi statistici e tecniche di machine learning per individuare la probabilità di risultati futuri basandosi sui dati storici. L'obiettivo è andare oltre la comprensione di cosa è successo per arrivare a una migliore valutazione di quello che accadrà in futuro.

Storia e progressi recenti dell’analisi predittiva

Sebbene l'analisi predittiva esista ormai da decenni, è una tecnologia più che mai attuale; sempre più organizzazioni stanno ricorrendo all'analisi predittiva per aumentare i loro profitti e acquisire vantaggio competitivo. Perché proprio ora?

  • Volumi e tipologie di dati sono in continua crescita, così come l'interesse delle aziende nell'utilizzo dei dati per ottenere informazioni di valore.
  • Computer più veloci e accessibili.
  • Software più facile da usare.
  • Condizioni economiche più complesse e necessità di differenziarsi dalla concorrenza.

In seguito alla crescente diffusione di software interattivi di facile utilizzo, l'analisi predittiva non è più esclusivo dominio di matematici e statistici: anche analisti e manager aziendali stanno sfruttando questa tecnologia.

 

 


Perché l’analisi predittiva è importante?

Le aziende stanno adottando l'analisi predittiva per risolvere problemi difficili e scoprire nuove opportunità. Tra gli usi più comuni vi sono i seguenti:

Rilevamento delle frodi. La combinazione di più metodi di analisi può migliorare l’individuazione di schemi (“pattern”) e prevenire i comportamenti criminali. Data la crescente preoccupazione per la cybersecurity, l'analisi comportamentale ad alte prestazioni permette di esaminare in tempo reale tutte le azioni avvenute su una rete per individuare anomalie che potrebbero indicare frodi, falle di sicurezza e minacce persistenti avanzate.

Ottimizzazione delle campagne di marketing. I predictive analytics vengono utilizzati per determinare le risposte o gli acquisti dei clienti, nonché per promuovere opportunità di cross-selling. I modelli predittivi aiutano le aziende ad attirare, fidelizzare e far crescere i loro clienti più redditizi. 

Miglioramento delle operazioni. Molte aziende utilizzano i modelli predittivi per prevedere le rimanenze di magazzino e gestire le risorse. Le compagnie aeree utilizzano l'analisi predittiva per determinare i prezzi dei biglietti. Gli hotel cercano di prevedere il numero di ospiti per una determinata notte in modo da massimizzare la percentuale di occupazione e aumentare i ricavi. L'analisi predittiva consente alle organizzazioni di funzionare in modo più efficiente.

Riduzione dei rischi. I punteggi di affidabilità creditizia che vengono utilizzati per valutare la probabilità di inadempienza di un acquirente, sono un ben noto esempio di analisi predittiva. Il “credit score” è in sostanza un numero generato da un modello predittivo che incorpora tutti i dati relativi all'affidabilità creditizia di una persona. Altri usi connessi ai rischi includono indennizzi assicurativi e riscossioni.

L'analisi predittiva nel mondo di oggi

Con l'analisi predittiva puoi andare oltre la comprensione di cosa è successo e del perché e scoprire informazioni utili per le tue azioni future. Scopri come l'analisi predittiva dà forma al mondo in cui viviamo.

Training and Books icon blue

Non hai competenze in analisi predittiva?

Questo e-book SAS contiene consigli pratici basati sull’esperienza reale di imprenditori e formatori che ti aiuteranno a trovare, mantenere e motivare i migliori talenti analitici.

Leggi l'ebook

Mettere a frutto l'analisi predittiva

Questo report di Harvard Business Review Insight Center
contiene 25 articoli su come utilizzare l'analisi predittiva nel processo decisionale e nella pianificazione.

Scarica

Article - Icon

In che modo l'analisi predittiva aggiunge valore alle tue attività di marketing?

Scopri come la marketing attribution aggiunge valore scientifico alle tue attività di marketing e spazza via le “magie”, sostituendo quindi ipotesi e modelli arbitrari con dati e analisi puntuali.

Leggi l’articolo

Le best practice per i migliori risultati di modellizzazione predittiva

Gestire e coordinare tutte le fasi del processo analitico può essere complesso. Impara come procedere passo dopo passo e ottenere risultati migliori e sempre più affidabili.

Scopri di più

 

Advanced Analytics

Il software di data mining SAS® utilizza algoritmi comprovati e all'avanguardia, progettati per aiutarti a risolvere le sfide più grandi.

Scopri di più sull'advanced analytics software di SAS

Chi la utilizza?

Qualunque settore di mercato può sfruttare l'analisi predittiva per ridurre i rischi, ottimizzare le operazioni e aumentare i ricavi. Ecco alcuni esempi.

Banche e Servizi Finanziari

Il mondo della finanza, dove sono in ballo enormi quantità di dati e denaro, ha sfruttato a lungo l'analisi predittiva per rilevare e ridurre le frodi, misurare il rischio di credito, massimizzare le opportunità di cross-/up-selling e fidelizzare i migliori clienti. Commonwealth Bank, ad esempio, usa gli analytics per prevedere le possibili attività fraudolente sulle transazioni prima che vengano autorizzate , entro 40 millisecondi dall'inizio della transazione.

Retail

Da quando un ormai famigerato studio ha dimostrato che gli uomini che acquistano pannolini spesso acquistano contemporaneamente anche della birra, i rivenditori in tutto il mondo hanno iniziato a utilizzare l'analisi predittiva per determinare quali prodotti rifornire e quali offerte sono più appropriate per i consumatori, nonché per valutare l'efficacia degli eventi promozionali. Staples ha analizzato il comportamento dei consumatori per ottenere un quadro completo dei propri clienti, ottenendo un ROI del 137%.

Oil, Gas & Utilities

Il settore energetico ha adottato con molta convinzione l'analisi predittiva, ad esempio per prevedere guasti alle apparecchiature e i fabbisogni futuri, mitigare i rischi per la sicurezza e l'affidabilità o migliorare le prestazioni complessive. Salt River Project è la seconda più grande società elettrica pubblica negli Stati Uniti e uno dei maggiori fornitori di acqua in Arizona. Le analisi dei dati provenienti dai sensori delle macchine indicano quando le turbine che generano energia elettrica necessitano di manutenzione.

Pubblica Amministrazione

Le pubbliche amministrazioni svolgono un ruolo chiave nel progresso delle tecnologie informatiche. Per decenni, il Census Bureau degli Stati Uniti ha analizzato i dati per comprendere le tendenze della popolazione. Oggi la PA utilizza l'analisi predittiva come avviene negli altri settori di mercato: per migliorare i servizi e le prestazioni, rilevare e prevenire le frodi, capire meglio il comportamento dei consumatori e anche per migliorare la sicurezza informatica.

Assicurazioni sanitarie

Oltre a rilevare i sinistri fraudolenti, il settore delle assicurazioni sanitarie si sta adoperando per identificare i pazienti maggiormente a rischio di malattie croniche e individuare gli interventi migliori. Express Scripts, una delle più importanti organizzazioni americane per la copertura della spesa farmaceutica, sfrutta l'analisi per identificare coloro che non seguono le terapie prescritte, con un risparmio di 1.500-9.000 $ a paziente.

Manifatturiero

Per le aziende di questo settore è molto importante identificare i fattori che portano a una riduzione della qualità e alle carenze nella produzione, nonché ottimizzare la gestione dei ricambi, del personale in servizio e della distribuzione. Lenovo è solo una delle aziende che utilizzano i predictive analytics per analizzare le richieste di garanzia, un'iniziativa che ha portato a una riduzione del 10-15% dei costi.

Gli Orlando Magic fanno... magie

Gli analytics applicati allo sport sono oramai famosi, in parte grazie a Nate Silver e alle sue statistiche. La squadra degli Orlando Magic in NBA usa l'analisi predittiva SAS per migliorare i propri ricavi e determinare le formazioni iniziali. Gli utenti di business degli Orlando Magic accedono immediatamente alle informazioni: possono così esplorare visivamente e in dettaglio i dati più recenti, da quelli relativi alla partita alla quantità di posti occupati dai tifosi in tribuna.

Leggi la storia completa degli Orlando Magic

Analisi predittiva testuale

Circa il 90% dei dati non è strutturato. Come puoi sfruttare l'analisi predittiva e trovare informazioni utili in tutti quei dati?

Scopri di più sul software di analisi testuale di SAS

Come funziona

I modelli predittivi sfruttano risultati noti per sviluppare (o addestrare) un modello che può essere utilizzato per prevedere valori di dati diversi o nuovi. La modellizzazione fornisce risultati sotto forma di previsioni che rappresentano la probabilità di una variabile target (ad esempio, il fatturato) in base alla significatività stimata a partire da un insieme di variabili di input.

I modelli descrittivi, al contrario, aiutano invece a capire cos’è successo, mentre i modelli diagnostici aiutano a capire le relazioni chiave e a determinare il motivo per cui qualcosa è successo. Alle tecniche e ai metodi analitici sono stati dedicati interi libri. Ci sono interi corsi universitari che approfondiscono questo argomento. Ma ai principianti possono bastare alcune basi. Eccole.

Esistono due tipi di modelli predittivi. I modelli di classificazione prevedono l'appartenenza a una classe. Ad esempio, si tenta di classificare se qualcuno è in procinto di andarsene, se risponderà a una sollecitazione, se è un rischio di credito “buono” o “cattivo”, ecc. Di solito, i risultati dei modelli sono sotto forma di 0 o 1, dove 1 è l'evento a cui si sta puntando. I modelli di regressione prevedono un numero, ad esempio a quanto ammonterà il ricavo generato da un cliente nell'anno successivo, oppure dopo quanti mesi si guasterà un componente di una macchina.

Tre delle tecniche di modellizzazione predittiva più utilizzate sono gli alberi decisionali, la regressione e le reti neurali.

 

La regressione (lineare e logistica) è uno dei metodi statistici più diffusi. L'analisi della regressione stima le relazioni tra le variabili. Destinata a dati continui che presumibilmente seguono una distribuzione normale, questa tipologia di analisi consente di trovare pattern chiave in insiemi di dati di grandi dimensioni e spesso viene utilizzata per determinare in che misura fattori specifici come il prezzo influenzano la circolazione di un bene. Con l'analisi della regressione si vuole prevedere un numero, chiamato risposta o variabile Y. Con la regressione lineare, una variabile indipendente viene utilizzata per spiegare e/o prevedere il risultato di Y. La regressione multipla utilizza due o più variabili indipendenti per prevedere il risultato. Con la regressione logistica, le variabili sconosciute di una variabile discreta vengono previste in base al valore noto di altre variabili. La variabile di risposta è categorica, ovvero può assumere solo un numero limitato di valori. Con la regressione logistica binaria, una variabile di risposta ha solo due valori come 0 o 1. Nella regressione logistica multipla, una variabile di risposta può avere diversi livelli, come basso, medio e alto, oppure 1, 2 e 3.

Gli alberi decisionali sono modelli di classificazione che dividono i dati in sottoinsiemi in base a categorie di variabili di input. Permettono quindi di comprendere il percorso decisionale di una persona. Un albero decisionale si presenta come un albero in cui ogni ramo rappresenta una scelta tra un numero di alternative e ogni foglia rappresenta una classificazione o una decisione. Questo modello esamina i dati e tenta di trovare la variabile specifica che divide i dati nei gruppi logici più diversi. Gli alberi decisionali sono molto conosciuti perché sono facili da capire e interpretare. Inoltre, gestiscono bene i valori mancanti e sono utili per la selezione preliminare delle variabili. Quindi, se hai molti valori mancanti o vuoi una risposta rapida e facilmente interpretabile, puoi iniziare con un albero.

 

 

 

Le reti neurali sono tecniche sofisticate in grado di modellare relazioni estremamente complesse. Sono apprezzate in quanto potenti e flessibili. In particolare, il loro valore risiede nella capacità di gestire le relazioni non lineari presenti nei dati, aspetto sempre più comune nella crescente quantità di dati che raccogliamo. Spesso si usano per confermare i risultati di tecniche semplici come la regressione e gli alberi decisionali. Le reti neurali si basano sul riconoscimento di pattern e su alcuni processi di intelligenza artificiale che “modellano” graficamente i parametri. Funzionano bene quando non si conosce una formula matematica che mette in relazione gli input con gli output, quando la previsione è più importante della spiegazione o ci sono molti dati di addestramento. In origine, le reti neurali artificiali sono state sviluppate da ricercatori che cercavano di simulare la neurofisiologia del cervello umano.

Altre tecniche utilizzate

Analisi bayesiana. I metodi bayesiani trattano i parametri come variabili casuali e definiscono la probabilità secondo i cosiddetti "gradi di fiducia" (ovvero, la probabilità di un evento equivale a quanto si ritiene che l'evento sia vero). Quando si esegue un'analisi bayesiana, si parte da una convinzione a priori circa la distribuzione di probabilità di un parametro sconosciuto. Una volta apprese le informazioni dai dati che si hanno a disposizione, la convinzione relativa al parametro sconosciuto cambia o si aggiorna.

Modelli Ensemble. I modelli Ensemble vengono prodotti addestrando vari modelli simili e combinando i loro risultati per migliorare la precisione, ridurre la distorsione, limitare la varianza e individuare il modello migliore da utilizzare con i nuovi dati.

Gradient boosting. Si tratta di un approccio basato sul potenziamento del gradiente e consiste nel ricampionare più volte i dati per generare risultati che costituiscono una media ponderata del set di dati ricampionato. Come gli alberi decisionali, il boosting non formula ipotesi sulla distribuzione dei dati. Il boosting è meno soggetto alla sovraparametrizzazione dei dati rispetto a un singolo albero decisionale e, se un albero decisionale è in grado di stimare abbastanza bene i dati, il boosting spesso migliora questa stima. (Sovraparametrizzazione dei dati, in inglese “overfitting”, significa che si stanno utilizzando troppe variabili e che il modello è troppo complesso. Il suo contrario è il cosiddetto “underfitting”: in questo caso non vi sono abbastanza variabili e il modello è troppo semplice. Entrambi questi approcci riducono l'accuratezza della previsione.)

Risposta incrementale (nota anche come modello incrementale o uplift). Modellizza il cambiamento di probabilità causato da un'azione. E' ampiamente utilizzata per ridurre il tasso di abbandono e per scoprire gli effetti dei diversi programmi di marketing.

Analisi del vicino più prossimo (k-nearest neighbor, k-nn). Questo è un metodo non parametrico per la classificazione e la regressione che prevede i valori di un oggetto o le appartenenze alle classi in base agli esempi di addestramento del vicino più prossimo (k-closest).

Ragionamento basato sulla memoria. Il ragionamento basato sulla memoria è una tecnica di vicino più prossimo (k-nearest neighbor) che serve a categorizzare o prevedere le osservazioni.

Minimi quadrati parziali. Questa tecnica statistica flessibile può essere applicata a dati di qualsiasi forma. Modella le relazioni tra input e output anche quando gli input sono correlati e fuorvianti, quando ci sono più output o quando ci sono più input che osservazioni. Il metodo dei minimi quadrati parziali ricerca i fattori che spiegano sia le variazioni di risposta che quelle dei predittori.

Analisi delle componenti principali. Lo scopo dell'analisi delle componenti principali è quello di ricavare un numero limitato di combinazioni lineari indipendenti (componenti principali) da un insieme di variabili che conservano il maggior numero possibile di informazioni nelle variabili originali.

Macchina a vettori di supporto. Questa tecnica di machine learning supervisionato sfrutta algoritmi di apprendimento associati per analizzare i dati e riconoscere i pattern. Può essere usata sia per la classificazione che per la regressione.

Data mining di serie storiche. I dati relativi alle serie storiche vengono contrassegnati con data e ora e raccolti nel tempo a intervalli particolari (vendite in un mese, chiamate al giorno, visite web all'ora, etc.). Il data mining delle serie storiche combina tecniche di data mining e di forecasting tradizionali. Tecniche di data mining come il campionamento, il clustering e gli alberi decisionali vengono applicate ai dati raccolti nel tempo con l'obiettivo di migliorare le previsioni.

Cosa ti serve per iniziare a utilizzare l'analisi predittiva?

Scopri di più su come sfruttare il ciclo di vita analitico secondo le tue esigenze

step1

La prima cosa di cui hai bisogno per iniziare a utilizzare l'analisi predittiva è un problema da risolvere. Cosa vuoi sapere sul futuro in base al passato? Cosa vuoi capire e prevedere? Sicuramente vorrai anche valutare cosa verrà fatto con le previsioni. Quali decisioni saranno dettate dalle informazioni ricavate? Quali azioni saranno intraprese?

step2

In secondo luogo avrai bisogno di dati. Nel mondo di oggi, questo comporta la raccolta di dati provenienti da molte fonti: sistemi transazionali, dati acquisiti dai sensori, informazioni di terze parti, appunti dei call center, registri web, etc. Avrai bisogno di un esperto di “data wrangling”, ovvero di qualcuno con esperienza nel data management che ti aiuti a pulire e preparare i dati per l'analisi. Per preparare i dati alla modellizzazione predittiva, è inoltre necessario poter contare su qualcuno in grado di comprendere sia i dati sia il problema di business. Il modo in cui definisci il tuo obiettivo è essenziale per capire come interpretare il risultato. (Nel processo di analisi, la preparazione dei dati è considerata uno degli aspetti più dispendiosi in termini di tempo, quindi tieniti pronto!)

step3

A questo punto inizia la costruzione del modello predittivo. La crescente facilità d’uso del software fa sì che sempre più persone possano sviluppare modelli analitici. Probabilmente avrai comunque bisogno di un esperto di analisi dei dati che possa aiutarti a perfezionare i tuoi modelli e ottenere il miglior risultato. Potresti anche aver bisogno di un addetto IT che possa aiutarti a implementare i tuoi modelli, ovvero applicare i modelli ai dati selezionati. È proprio in questa fase che ottieni i risultati.

step4

La modellizzazione predittiva richiede un lavoro di squadra. Hai bisogno di persone che capiscano il problema di business da risolvere. Qualcuno che sappia come preparare i dati per l'analisi. Qualcuno che sia in grado di costruire e perfezionare i modelli. Qualcuno dell'IT che verifichi di avere la giusta infrastruttura di analisi per la creazione e l'implementazione dei modelli. E infine uno sponsor esecutivo che contribuisca a tradurre le tue speranze analitiche in realtà.

Scopri di più su questo argomento