Teal abstract honeycomb background with white line art overlay

Machine Learning

Che cos'è e perché ha importanza

Il machine learning è un metodo di analisi dati che automatizza la costruzione di modelli analitici. È una branca dell'Artificial Intelligence e si basa sull'idea che i sistemi possono imparare dai dati, identificare modelli autonomamente e prendere decisioni con un intervento umano ridotto al minimo.

L'evoluzione del machine learning

I primi ricercatori interessati all'intelligenza artificiale volevano scoprire se i computer potessero apprendere dai dati. Il machine learning, l'apprendimento automatico, nasce dalla teoria che i computer possono imparare ad eseguire compiti specifici senza essere programmati per farlo, grazie al riconoscimento di schemi tra i dati. Il machine learning utilizza algoritmi che imparano dai dati in modo iterativo. Permette, ad esempio, ai computer di individuare informazioni anche sconosciute senza che venga loro segnalato esplicitamente dove cercarle.

L'aspetto più importante del machine learning è la ripetitività, perchè più i modelli sono esposti ai dati, più sono in grado di adattarsi in modo autonomo. I computer imparano da elaborazioni precedenti per produrre risultati e prendere decisioni che siano affidabili e replicabili.

Grazie alle nuove tecnologie di elaborazione, il machine learning di oggi non è il machine learning del passato. Questa scienza non è nuova ma sta acquisendo un nuovo slancio. E sebbene molti algoritmi di machine learning siano in circolazione da molto tempo, la capacità di applicare calcoli matematici complessi ai big data è uno sviluppo più recente. Qui troverai alcuni esempi ampiamente conosciuti di utilizzo del machine learning che potrebbero suonarti familiari:

  • La guida autonoma? L'essenza del machine learning.
  • I suggerimenti di offerte online come quelli di Amazon o Neflix? L'applicazione del machine learning alla vita quotidiana.
  • Sapere cosa dicono della tua azienda i clienti su Twitter? Machine learning abbinato alla creazione di regole linguistiche.
  • Intercettazione di una frode? Uno dei suoi utilizzi meno ovvi ma sempre più frequenti.

 

Le basi del machine learning

Che cos'è il machine learning e perchè sta diventando così popolare? Questo breve video spiega tutto ciò che devi sapere sulla tecnologia SAS - cosa fa, come funziona, e come sta influenzando il modo di fare business.

Perchè il machine learning è importante?

Il rinnovato interesse nel machine learning è dovuto agli stessi fattori che hanno reso il data mining e le analisi Bayesiane più popolari che mai. Come ad esempio: crescita del volume e della varietà dei dati, processi computazionali più economici e più potenti e spazi di archiviazione dati a buon mercato.

Tutto ciò significa che ora è possibile produrre, in modo veloce ed automatico, modelli in grado di analizzare dati più grandi e complessi ed di elaborare velocemente risultati più accurati - anche su larga scala. La costruzione di modelli precisi, dà a un'organizzazione delle chance migliori di identificare opportunità di profitto - o evitare rischi sconosciuti.

 

Cosa serve per creare dei buoni sistemi di machine learning?

  • Capacità di preparazione dei dati.
  • Algoritmi - base e avanzati.
  • Processi di automazione iterativi.
  • Scalabilità.
  • Ensemble modeling.
Machine learning infographic

Sapevi che...

  • Nel machine learning, un target è chiamato label.
  • In statistica, un target è chiamato variabile dipendente.
  • Una variabile in statistica è chiamata feature nel machine learning.
  • Una trasformazione in statistica è chiamata feature creation nel machine learning.

Machine learning nel mondo di oggi

Usando gli algoritmi per la costruzione di modelli che svelano connessioni, le organizzazioni possono prendere decisioni migliori senza bisogno dell'intervento umano. Scopri di più su questa soluzione che sta trasformando il mondo in cui viviamo.

La tua guida al Machine Learning

La tua guida al Machine Learning

Leggi questo eBook per scoprire quali sono i vantaggi e i benefici per le aziende portati dal Machine Learning.

Una panoramica sulle sue tecniche innovative, oltre a 10 best practice e una checklist per valutare il livello di maturità della tua azienda in tema di Machine Learning e Artificial Intelligence.

Scaricalo gratuitamente

Opportunità e sfide del machine learning nelle aziende

Questo white paper O'Reilly fornisce una guida pratica all'implementazione del machine learning nelle aziende.

Leggi il white paper

Machine Learning per il credit scoring

Come può il machine learning rendere il credit scoring più efficiente? Scopri come viene utilizzato, ad esempio, per valutare l'affidabilità di chi richiede un prestito finanziario.

Leggi l'articolo

Machine Learning Webinar Series

Una serie di 4 webinar On Demand in italiano per comprendere cos'è il Machine Learning e come è possibile migliorare le decisioni aziendali grazie al suo utilizzo.

Guarda i webinar

Machine Learning e Internet of Things

Il machine learning può essere utilizzato per raggiungere livelli di efficienza più elevati. In particolare se applicato all'Internet of Things. Scopri come in questo articolo.

Guarda il webinar

yellow and orange abstract art
Data Mining Enterprise Miner

Gli advanced analytics di SAS


Il machine learning non è una tecnologia specifica in senso stretto poiché coinvolge software come data mining e forecasting, strumenti indispensabili per analizzare grandi volumi di dati e scoprire le informazioni di business veramente utili per la tua azienda. Il segreto? Gli algoritmi innovativi che da sempre costituiscono il cuore delle soluzioni SAS®.

Scopri di più sugli advanced analytics di SAS

Chi lo usa?

Molti settori che lavorano con grandi volumi di dati hanno riconosciuto il valore della tecnologia machine learning. Raccogliendo informazioni dai dati - spesso in tempo reale - le organizzazioni sono i grado di lavorare con più efficienza o acquistare vantaggio competitivo.

Servizi finanziari

Banche e aziende nell'industria finanziaria utilizzano le tecnologie machine learning con due principali scopi: identificare informazioni importanti nei dati e prevenire la frode. Le informazioni possono identificare opportunità d'investimento e aiutare gli investitori a sapere quando agire. Il data mining, invece può identificare clienti con profili altamente a rischio o utilizzare la sorveglianza informatica per segnalare allarmi di possibile frode.

Pubblica amministrazione

Gli enti pubblici che si occupano ad esempio di pubblica sicurezza o dei servizi hanno particolare bisogno del machine learning, avendo esse svariate sorgenti di dati che possono essere setacciate alla ricerca di informazioni. Se ad esempio si vuole aumentare l'efficienza e risparmiare denaro, si analizzano i dati dei sensori. Inoltre, il machine learning può aiutare a individuare frodi e ridurre il fenomeno del furto d'identità.

Assistenza sanitaria

Il machine learning è una tendenza che sta crescendo velocemente nell'industria dell'assistenza sanitaria, grazie all'avvento di dispositivi indossabili e a sensori che utilizzano i dati per verificare in tempo reale lo stato di salutre di un paziente. Inoltre, questa tecnologia aiuta i consulenti medici nell'analisi dei dati identificando tendenze o segnali d'allarme che potrebbero condurre a diagnosi e trattamenti migliori.

Marketing e vendite

I siti web che ti consigliano gli articoli che ti potrebbero interessare, basandosi su acquisti fatti in precedenza, utilizzano il machine learning per analizzare la cronologia dei tuoi acquisti. Il futuro del commercio al dettaglio risiede nella capacità di memorizzare, analizzare e usare i dati per personalizzare l'esperienza d'acquisto o integrare una campagna di marketing.

Gas e petrolio

Trovare nuove risorse energetiche. Analizzare i minerali nel suolo. Prevedere un guasto dei sensori in raffineria. Snellire la distribuzione di petrolio per renderla più efficiente e redditizia. In questo settore il machine learning viene usato in un numero molto vasto di casi - ed è un dato in costante aumento.

Trasporti

L'analisi dei dati al fine di identificare schemi e tendenze è fondamentale nell'industria dei trasporti, che per aumentare il proprio profitto, fa affidamento sulla creazione di rotte più efficienti e sulla previsine dei potenziali problemi. Gli strumenti presenti nel machine learning per l'analisi dei dati e la creazione di modelli sono utili alle società di consegne, ai trasporti pubblici e alle altre ditte di trasporto.

Quali sono le più popolari forme di machine learning?

Due dei metodi di machine learning maggiormente adottati sono l'apprendimento supervisionato e l'apprendimento non supervisionato – ma esistono anche altri metodi di machine learning. Ecco una panormaica delle forme più popolari.

Apprendimento supervisionato
Questi algoritmi vengono allenati utilizzando esempi etichettati, come richieste di cui si conoscono già le risposte. Per esempio, un apparecchio potrebbe avere alcuni punti di dati etichettati con "F" (failed) o "R" (runs). L'algoritmo di apprendimento impara abbinando input ad output corrispondenti (F con F, R con R) e compara poi questi risultati per trovare gli errori. Per poi modificare il modello di conseguenza. Attraverso metodologie come classificazione, regressione, previsione e gradient boosting, l'apprendimento supervisionato utilizza dei modelli per prevedere il valore delle etichette in dati non ancora etichettati. L'apprendimento supervisionato è comunemente utilizzato in applicazioni dove i dati storici sono in grado di predire possibili eventi futuri. Ad esempio può prevedere se le operazioni effettuate con alcune carte di credito possono essere fraudolente oppure quali clienti di un'azienda assicurativa potrebbero chiedere un risarcimento.

Apprendimento semi supervisionato
Ha le stesse applicazioni dell'apprendimento supervisionato. Ma per l'allenamento utilizza dati etichettati e non - si tratta solitamente di un ridotto volume di dati etichettati, e di un ampio volume di dati non etichettati (perchè acquisire dati non etichettati è più economico e meno faticoso). Questo tipo di apprendimento può essere utilizzato con metodi quali classificazione, regressione e previsione. L'apprendimento semi supervisionato è utile se etichettare ha un costo troppo alto per permettere un processo di allenamento completamente etichettato. Un esempio recente di ciò sono le fotocamere che identificano il volto delle persone.

Apprendimento non supervisionato
Viene utilizzato su dati che non hanno etichette storiche. Al sistema non viene forita la "risposta giusta". L'algoritmo deve scoprire cosa gli viene mostrato. L'obiettivo è quello di esplorare i dati e individuarne una struttura interna. L'apprendimento non supervisionato funziona bene con i dati commerciali. Ad esempio, può individuare segmenti di consumatori con caratteristiche simili a cui rivolgere le campagne di marketing in modo simile. O può trovare gli attributi principali che differenziano i segmenti di consumatori gli uni dagli altri. Alcune tecniche del momento includono mappe self-organize, mappature nearest-neighbor, algoritmi k-means clustering e decomposizione ai valori singolari. Questi algoritmi vengono anche usati per segmentare topic di testo, consigliare prodotti o identificare valori anomali.

Apprendimento per rinforzo
Spesso viene usato in robotica, videogiochi e navigazione. Con l'apprendimento per rinforzo l'algoritmo scopre da quali azioni vengono prodotte le ricompense maggiori, passando per esperimenti ed errori. Questo tipo di apprendimento presenta tre componenti principali: l'agente (chi impara o prende decisioni), l'ambiente (tutto ciò con cui l'agente interagisce) e le azioni (cosa può fare l'agente). L'obiettivo dell'agente è scegliere quelle azioni che massimizzano la ricompensa prevista in un determinato lasso temporale. Seguendo delle buone norme, l'agente raggiungerà l'obiettivo più velocemente. Quindi l'obiettivo dell'apprendimento per rinforzo è quello di imparare le norme migliori.

Di solito gli umani possono creare uno o due buoni modelli a settimana,
il machine learning può crearne migliaia a settimana.

Thomas H. Davenport, Analytics thought leader
excerpt from The Wall Street Journal

 

Quai sono le differenze tra data mining, machine learning e deep learning?

Sebbene tutti questi metodi abbiano un obiettivo comune - estrarre informazioni, schemi e relazioni che possono essere usati per prendere decisioni - hanno approcci e abilità differenti.

 

Data mining infographic

Data Mining

Il data mining può essere considerato come un super assortimento di molti metodi diversi per estrarre informazioni dai dati. Può coinvolgere metodi statistici tradizionali e machine learning. Il data mining applica metodi da molte aree differenti per identificare in anticipo schemi sconosciuti nei dati. Questo può compendere algoritmi statistici, machine learning, analytics di testo, analisi delle serie temporali e altre aree degli analytics. Il data mining comprende anche lo studio e l'allenamento sull'archiviazione dei dati e la loro manipolazione.

 

Machine learning infographic

Machine Learning

La differenza principale con il machine learning è che, proprio come per i modelli statistici, l'obiettivo è capire la struttura dei dati. Per quanto riguarda i modelli statistici, dietro ad ogni modello esiste una teoria matematica comprovata, ma perchè ciò accada i dati devono soddisfare alcuni presupposti specifici. Mentre il machine learning si è sviluppato basandosi sull'abilità di usare i computer per sondare i dati alla ricerca di una struttura, anche se non si ha una teoria specifica di come potrebbe presentarsi quella struttura. Per testare un modello di machine learning ci si basa sugli errori di convalida dei nuovi dati, non è un test teorico che prova un'ipotesi senza valore. L'apprendimento può essere facilmente automatizzato, perchè spesso il machine learning utilizza un approccio iterativo. Vengono eseguiti molteplici passaggi attraverso i dati finchè non si individua uno schema solido.

Deep learning infographic

Deep learning

Il Deep learning combina computer sempre più potenti a speciali tipi di sistemi neuronali per apprendere i complicati schemi dei grandi volumi di dati. I ricercatori stanno cercando di applicare gli esempi riusciti di riconoscimento di schemi a compiti più complessi come traduzione linguistica automatica, diagnosi mediche e altri innumerevoli problemi sociali ed aziendali.

Come funziona

Per ottenere il massimo del valore dal machine learning devi imparare ad abbinare i migliori algoritmi agli strumenti e ai processi corretti. SAS combina le ricche e sofisticate conoscienze di statistica e data mining  ai nuovi sviluppi dell'architettura software per assicurarti che i tuoi modelli funzionino il più velocemente possibile - anche in aziende dagli ambienti molto estesi.

 

Algoritmi: Le interfacce grafiche SAS ti aiutano a costruire modelli di machine learning e applicare processi machine learning iterativi. Non c'è bisogno che tu sia un grande statistico. La nostra selezione esaustiva di algoritmi può aiutarti velocemente ad ottenere valore dai tuoi big data ed è inclusa in molti dei prodotti SAS. Gli algoritmi di machine learning SAS includono:

Neural networks
 
Decision trees
 
Random forests
 
Associations and sequence discovery
 
Gradient boosting and bagging
 
Support vector machines
 
Nearest-neighbor mapping
 
k-means clustering
 
Self-organizing maps
 

Local search optimization techniques (e.g., genetic algorithms)

Expectation maximization

Multivariate adaptive regression splines

Bayesian networks
 
Kernel density estimation
 
Principal component analysis
 
Singular value decomposition
 
Gaussian mixture models
 
Sequential covering rule building

 

Strumenti e Processi: Come ben saprai a questo punto, non si tratta solo di algoritmi. In definitiva, il segreto per ottenere il massimo del valore dai tuoi big data sta nell'abbinare i migliori algoritmi disponibili a:

Gestione completa dei dati e della loro qualità
 
Comparazione di diversi modelli di machine learning per identificare velocemente quali sono i migliori
 
Strumenti interattivi di data exploration e data visualization sui risultati dei modelli
 
Applicazione di ensemble model per individuare il più performante
 
 
GUI per costruire modelli e flussi di processo

Distribuzione semplificata dei modelli per ottenere rapidamente risultati affidabili e replicabili

Una piattaforma end-to-end integrata, per rendere automatico il passaggio dal dato alla decisione
Couple looking at monitor

Le soluzioni SAS ti interessano?

Vuoi maggiori informazioni?
Scopri le varie possibilità a tua disposizione.

Pronto allo step successivo?
Fai un passo ulteriore e ottieni il massimo dai tuoi dati.

Back to Top