Mettersi alla prova con passione: l’esperienza di Elia e Luigi
con SAS Curiosity Cup
Articolo di Cinzia Gianfiori, Sr. Global Academic Program Manager SAS
Team internazionali di studenti alle prese con dati e analytics. Tra i finalisti, il team italiano che ha indagato sulla correlazione tra l’utilizzo del tabacco non da fumo e l’insorgenza di ictus.
SAS Curiosity Cup, la competizione internazionale dedicata al mondo dei dati e degli analytics, nelle scorse settimane ha visto squadre di studenti da tutto il mondo alle prese con questa appassionante sfida.
10 team di studenti ambiziosi e curiosi si sono classificati per la fase finale della competizione con i loro progetti in tre diverse categorie: Data Preparation, Data Analysis, Data Presentation. Una giuria di 10 esperti ha poi valutato il loro lavoro, assegnando i premi per ogni categoria. Ma i vantaggi della partecipazione vanno ben oltre il premio.
SAS Curiosity Cup offre agli studenti la possibilità di intraprendere un viaggio di scoperta, dalla ricerca dell’argomento al reperimento e all'analisi dei dati, fino alla realizzazione di un elaborato che metta in mostra le loro abilità analitiche. Inoltre, essere finalisti significa farsi notare dalle aziende o dalle scuole di specializzazione, un riconoscimento importante per la loro carriera professionale. Infine, SAS Curiosity Cup rappresenta un vantaggio anche per le comunità accademica perché promuove la ricerca innovativa e incoraggia la collaborazione interdisciplinare.
Nelle scorse settimane ho avuto il piacere di intervistare i due finalisti Elia Gonzato e Luigi Annicchiarico, studenti di Biostatistica all’Università degli Studi di Milano Bicocca, che avevo già conosciuto alcuni mesi prima in quanto entrambi hanno ottenuto la certificazione SAS nel 2022. Ecco quanto è emerso dalla nostra chiacchierata.
Un ricordo che porterò con me da questa esperienza sono le discussioni fatte con il mio compagno di squadra, che mi hanno aiutato a cambiare prospettiva e il mio modo di pensare e di affrontare i problemi incontrati durante lo sviluppo del progetto.
Elia Gonzato
Studente di Biostatistica all’Università degli Studi di Milano Bicocca
Parlateci del vostro progetto: quale tema avete affrontato e come avete utilizzato i dati?
Per il nostro progetto abbiamo scelto di indagare la correlazione tra l’utilizzo del tabacco non da fumo e l’insorgenza di ictus, utilizzando dati provenienti dal ‘Behavioral Risk Factor Surveillance System (BRFSS) 2020’, un censimento sulle abitudini degli abitanti degli Stati Uniti condotto dal Centers for Disease Control and Prevention (CDC).
Durante la ricerca dei dati, ci siamo imbattuti in un dataset particolarmente interessante: aveva un gran numero di variabili che approfondivano le abitudini di vita dei pazienti intervistati. Molte variabili, avevano valori mancanti. Inoltre, il dataset era caratterizzato da un ampio numero di osservazioni.
Ciò che ci ha convinto della rilevanza di questo dataset è stata la presenza di variabili che descrivevano abitudini di vita o caratteristiche cliniche non comuni, che potessero essere esplorate per fornire misure di associazione con eventi negativi per la salute.
Vista la mancanza di alcuni dati nel dataset, aspetto che avrebbe potuto condizionare i risultati, abbiamo deciso di procedere attraverso due vie parallele:
- escludere i dati mancanti e stimare l’associazione tra l’utilizzo di Snuff e l’ictus con una regressione logistica,
- ricostruire la variabilità non osservata a causa dei dati mancanti, imputandoli, per poi svolgere una regressione logistica, con il dataset completo.
Abbiamo infine confrontato i risultati ottenuti dalle due analisi.
I momenti migliori sono forse stati quelli in cui il progetto sembrava essere su un binario morto, momenti in cui abbiamo dovuto prendere decisioni complicate e talvolta azzardate, ma non abbiamo mai perso il sorriso e la voglia di divertirci.
Luigi Annichiarico
Studente di Biostatistica all’Università degli Studi di Milano Bicocca
Quali risultati avete ottenuto?
La prima tipologia di analisi ha riportato che l’associazione tra utilizzo di tabacco non da fumo e ictus è statisticamente significativa, sebbene abbia un impatto meno rilevante del fumo. Al contrario, nella seconda tipologia di analisi non è stata raggiunto lo stesso risultato. In questo caso, a seguito dell’imputazione dei dati mancanti, abbiamo ottenuto un intervallo di confidenza più ampio rispetto all’analisi con i dati missing in quanto abbiamo riprodotto la variabilità dei dati. La stima puntuale è rimasta però inalterata e possiamo quindi concludere che i risultati fossero sufficientemente affidabili, nonostante l’interpretazione dell’associazione tra i due fattori richieda una certa cautela.
Come è stata la vostra esperienza con il software SAS? Cosa ne pensate?
Questa competizione ci ha dato la possibilità di approfondire le nostre conoscenze nel campo della biostatistica e di esplorare nuovi argomenti che risultano essere di particolare interesse per il campo in cui lavoriamo. Il software SAS ci ha accompagnato durante lo sviluppo del progetto, supportandoci per le analisi statistiche, lo sviluppo di grafici e l’utilizzo di procedure, a noi non ancora note, come quella di imputazione dei dati mancanti. La documentazione, ben organizzata, ci ha consentito di comprendere la procedura nei dettagli.
Quali competenze avete maturato nel vostro corso di laurea grazie agli insegnamenti in cui si usa SAS? Ritenete utile SAS Skill Builder for Students per la vostra formazione
Il nostro corso di laurea ci ha fornito diverse competenze riguardo il software SAS, dalle basi di programmazione fino ad argomenti più avanzati, come le simulazioni di numeri casuali da distribuzioni definite, la creazione di macro-programmi e l’approfondimento delle strategie di analisi per l’ambito nel quale operiamo, come l’analisi della sopravvivenza, modelli ad effetti casuali e modelli multilevel.
La piattaforma di e-learning messa a disposizione da SAS è un ottimo strumento per imparare dalle basi e per approfondire le proprie conoscenze. Il materiale è chiaro ed esaustivo.
Parliamo di formazione e di formazione continua. Quanto è importante secondo voi in un ambito come quello dei dati e del tech?
Ogni giorno vengono fatti nuovi passi in avanti nel mondo dei dati e della tecnologia, mantenersi aggiornati e curiosi di imparare è un requisito fondamentale per una carriera dinamica e di successo. Ciò che davvero conta è essere curiosi, avere voglia di scoprire e di comprendere, sempre.
Complimenti alla squadra italiana SASnuff dell’Università di Milano Bicocca , composta da Elia Gonzato, Luigi Annichiarico e dal Professor Vincenzo Bagnardi, per avere guadagnato il secondo posto nella categoria Data Analysis di Curiosity CUP 2023.
Grazie Elia e Luigi per averci raccontato la vostra esperienza.
SAS Skill Builder for Students: di cosa si tratta esattamente?
SAS Skill Builder for Students è un portale gratuito che offre ai giovani studenti l’opportunità di entrare in contatto reale con SAS, seguendo molteplici corsi in e-learning. Naturalmente, oltre a testare con mano i vantaggi che comporta l’uso del software, il completamento di ogni corso dà diritto a un digital badge, che testimonia le competenze acquisite: un riconoscimento particolarmente utile perché molto apprezzato dalle aziende alla ricerca di giovani talenti, soprattutto quelle che prediligono l’uso degli analytics.
28 aprile 2023
Articoli consigliati
-
Innovation SparksModernizzare il processo decisionale: la chiave per un onboarding efficace e sicuro nel settore finanziarioCome implementare un processo decisionale che aiuti gli istituti finanziari a mettere in atto misure proattive per salvaguardare i clienti e difendersi dalle attività fraudolente lungo l'intero customer lifecycle.
-
Innovation SparksPerché l’intelligenza artificiale non può prescindere dall’eticaNon c’è bontà o malvagità intrinseca nella tecnologia IA: esistono solo rischi e ricompense, ma proprio per questo la tecnologia da sola non è mai sufficiente e dobbiamo usarla in modo responsabile.
-
Innovation SparksIl successo dell'Implementazione della GenAI: una guida per le aziendePer aiutare le aziende a navigare nel mare ampio della Generative AI, SAS e Coleman Parkes Research Ltd, hanno condotto uno studio globale che ha identificato quattro elementi chiave per l'implementazione efficace della GenAI.
-
Innovation SparksL'unica costante del nostro futuro dominato dall'AI? I datiNell'era della GenAI, i dati saranno probabilmente la risorsa aziendale più importante del futuro. Articolo di Marinela Profi, Global AI e GenAI Lead di SAS.