Machine Learning: il cuore matematico dell’intelligenza artificiale tra fiducia e responsabilità
Fidarsi degli algoritmi può essere difficile. Servono approcci responsabili che aiutino
l’essere umano a comprendere i processi decisionali delle macchine.
Scordiamoci la sfera di cristallo capace di darci la soluzione
Di Cristina Conti, Global Technology Practice Advanced Analytics e AI - SAS
In linea di massima, quando si parla di data science ci si riferisce all’abilità di estrarre informazioni di valore dai dati, di machine learning quando ci riferiamo all’insieme di tecniche e algoritmi per poter estrarre queste informazioni, di AI quanto utilizziamo questi algoritmi per replicare comportamenti tipicamente umani.
Moltissime persone, però, associano il machine learning al deep learning come se fossero sinonimi. In realtà Il deep learning è l’insieme di tecniche appartenenti alla famiglia delle reti neurali che sta aiutando a proiettare il machine learning verso il futuro. Cioè verso l’abilità di analizzare dati “emozionali” quali immagini, video, testi e conversazioni.
Supervisione o apprendimento con rinforzo… ma come imparano gli algoritmi?
Caratteristica classica degli algoritmi è la presenza di feature (le informazioni che usiamo per indagare) e di label (le informazioni che vogliamo prevedere). Tipicamente si differenzia tra modelli supervisionati e non supervisionati per identificare o meno la presenza di tali label. Ci sono poi modelli ibridi, come i modelli semi-supervisionati (dove ad esempio una feature è allo stesso tempo un label) o modelli di reinforcement learning, per cui il concetto di supervisione perde senso perché non è possibile definire label e feature, in un processo di apprendimento continuo.
Fiducia, ma niente sfere di cristallo. Etica e responsabilità rimangono “umani”
Il machine learning, va detto, non è una sfera di cristallo, va guidato nella ricerca e nella soluzione dei task che gli vengono assegnati per evitare che si prospetti uno scenario futuristico dove le decisioni si prendano sulla base di processi “black box”, ossia mediante algoritmi difficili da comprendere, interpretare e motivare.
Negli analytics “tradizionali”, guidati da un albero decisionale, è abbastanza semplice per l’uomo ricostruire i passaggi che hanno portato ad un output e quindi anche stabilire responsabilmente le azioni da intraprendere. I processi che portano all’output mediante tecniche di machine learning, al contrario, non consentono di risalire all’albero, cioè rendono molto complesso capire come l’algoritmo è arrivato a tale conclusione.
Fairness, accountability e trust: ecco il machine learning che funziona
Se riuscire ad interpretare correttamente gli algoritmi può essere compito davvero arduo per l’essere umano, va però detto che la comunità scientifica sta da tempo lavorando ad approcci di fairness, accountability e trust utili per avere una “interpretazione locale” (metodologie che prendono il nome di LIME - Local Interpretable Model-agnostic Explanations).
Queste tecniche aiutano l’uomo non tanto a ricostruire l’albero decisionale (che significherebbe ricostruire l’interpretazione dell’algoritmo completo) ma a capire, per uno specifico output, quali siano state le variabili determinanti che hanno inciso sul processo decisionale generando quello specifico output.
Non dobbiamo commettere l’errore di pensare che la macchina impari sempre e comunque. Il Machine Learning va guidato dall’uomo nella ricerca e nella soluzione dei task che gli vengono assegnati.
Il caso del lupo e dell’husky
Uno degli esempi più noti in letteratura e molto utile per capire il concetto di ‘trust’ - e quindi di responsabilità decisionale attraverso l’utilizzo del machine learning - è la ‘storia del lupo e dell’husky’.
Nell’ambito del riconoscimento delle immagini, agli algoritmi vengono dati ‘in pasto’ gradi moli di dati per poter apprendere le immagini e restituirne un output. Nel caso del lupo e dell’husky, l’algoritmo di machine learning utilizzato nell’esperimento aveva imparato che il lupo ha il pelo più scuro mentre l’husky ha il manto più chiaro. Un output che però l’algoritmo non sempre riusciva a fornire in modo corretto, attribuendo a volte all’husky la natura di lupo.
Utilizzando una metodologia di tipo LIME si è scoperto che ‘l’errore’ dipendeva dallo sfondo (una variabile): quando lo sfondo era molto chiaro (per esempio la neve), l’husky risultava avere un pelo più scuro dello sfondo dell’immagine, quindi l’algoritmo gli attribuiva impropriamente la natura di lupo.
Ciò che insegna questo caso è che, pur non conoscendo l’albero decisionale, è possibile capire qual è la variabile che incide sull’output e stabilire quindi con più serenità se tale output sia da prendere in considerazione o meno. In ogni caso, è sempre all’uomo che spetta la decisione finale.
Hot topics in ambito MACHINE LEARNING
Reti Neurali
algoritmi in grado di simulare il funzionamento del cervello umano attraverso interconnessioni e livelli di apprendimento estremamente sofisticati.
Deep Learning
insieme di tecniche avanzate appartenenti alla famiglia delle reti neurali. Utilizzate soprattutto per l'analisi di immagini, video e suoni.
Natural Language Processing
abilita la comprensione, l'interazione e la comunicazione tra esseri umani e macchine consentendo alle macchine di comprendere il linguaggio scritto e/o i comandi vocali.
I
Intelligenza Artificiale
Utilizzo degli algoritmi per replicare comportamenti tipici umani.
S
Supervised Learning
Vengono forniti alla macchina esempi che contengono dati classificati ed etichettati e il risultato atteso. La macchina utilizza questi input per determinare correlazioni e la logica da applicare per prevedere la risposta.
Tecniche più diffuse: logistic, regression, gradient boosting.
S
Semi Supervised Learning
A metà tra supervisionato e non-supervisionato, questo metodo si basa su dati misti: alla macchina vengono forniti sia dati con la risposta/output atteso, sia dati privi di tale informazione.
Tecniche più diffuse: autoencoder, TSVM
M
Machine Learning
Insieme di tecniche e algoritmi per poter estrarre informazioni dai big data. È possibile classificare almeno 4 tipologie di Machine Learning: supervised, unsupervised, semi supervised e reinforcement learning.
N
Non Supervised Learning
La macchina "studia" i dati per identificare modelli. In questo caso non c'è un output definitivo/atteso. La macchina determina correlazioni e relazioni dall'analisi dei dati disponibili.
Tecniche più diffuse: clusterizzazione K-means, PCA - analisi delle componenti principale.
R
Reinforcement Learning
Alla macchina vengono fornite una serie di regole e obiettivi ben definiti. Dall'applicazione delle regole all'esplorazione delle differenti azioni e successive reazioni, la macchina impara a sfruttare le regole per creare l'output desiderato/atteso. Si tratta di un apprendimento basato sui cambiamenti e variazioni dell'ambiente attraverso il rinforzo delle prestazioni.
Tecniche più diffuse: Q-Learning, Artificial Neural Networks
Articolo tratto da
Trend by itasascom
Speciale Machine Learning
Letture consigliate
- ARTICOLO 4 strategies that will change your approach to fraud detectionAs fraudulent activity grows and fighting fraud becomes more costly, financial institutions are turning to anti-fraud technology to build better arsenals for fraud detection. Discover four ways to improve your organization's risk posture.
- ARTICOLO Analytics tackles the scourge of human traffickingVictims of human trafficking are all around us. From forced labor to sex work, modern-day slavery thrives in the shadows. Learn why organizations are turning to AI and big data analytics to unveil these crimes and change future trajectories.
- ARTICOLO Risk data infrastructure: Staying afloat on the regulatory floodWhat are the challenges of a risk data infrastructure and how can they be addressed? Here's what you need to know to build an effective enterprise risk and finance reporting warehouse that will effectively address compliance requirements.
- ARTICOLO Customer Data Platform: cos’è e perché è importanteLa crescente popolarità della CDP ha comportato altresì un'aumento della confusione sui mercati. In queste pagine puoi trovare risposta a molte delle domande principali, tipo: come funziona la CDP, quali sono le complessità da prendere in considerazione e come posso integrarla nella mia strategia aziendale.
Ready to subscribe to Insights now?
The results illustrated in this article are specific to the particular situations, business models, data input, and computing environments described herein. Each SAS customer’s experience is unique based on business and technical variables and all statements must be considered non-typical. Actual savings, results, and performance characteristics will vary depending on individual customer configurations and conditions. SAS does not guarantee or represent that every customer will achieve similar results. The only warranties for SAS products and services are those that are set forth in the express warranty statements in the written agreement for such products and services. Nothing herein should be construed as constituting an additional warranty. Customers have shared their successes with SAS as part of an agreed-upon contractual exchange or project success summarization following a successful implementation of SAS software. Brand and product names are trademarks of their respective companies. Per questo articolo: © Copyright dell'editore. L'articolo non è riproducibile senza il suo consenso.