SAS
News Partner Academic Opportunità di Lavoro Contattateci Resource Center
Home Soluzioni e Tecnologie Referenze eventi Supporto Clienti Servizi e Formazione Chi Siamo www.sas.com

Metodi statistici per la classificazione comportamentale delle carte fedeltà.

Alessandra Corradino, Facoltà di Economia
Relatore: prof. Paolo Giudici

L'utilizzo della cluster analysis consente di classificare le unità statistiche al fine di formare gruppi il più possibile omogenei al loro interno ed eterogenei tra di loro, mettendo in evidenza le caratteristiche che accomunano gli elementi di uno stesso gruppo e rendono ciascuno di essi distinto dagli altri. Questo tipo di analisi presenta il vantaggio di ridurre le dimensioni dei dati da analizzare: dal numero totale di unità statistiche al numero dei clusters. Si tratta di un metodo di indagine parzialmente soggettivo nel quale le scelte da compiere sono lasciate alla competenza del ricercatore, per il quale ogni decisione è condizionata dall'obiettivo finale; si tratta anche di un metodo esplorativo, che dà risultati positivi per l'interpretazione dei gruppi solo se questi sono già esistenti, anche se non evidenti, nella popolazione osservata. La classificazione di una popolazione permette così di identificare le caratteristiche dei diversi gruppi. Per questo motivo l'impiego di tale metodologia è di grande rilevanza per le aziende che, mediante le conclusioni tratte dalla applicazione della cluster analysis, possono definire le strategie di mercato al fine di conseguire un vantaggio competitivo all'interno del settore in cui esse operano, con la ricerca e l'ottenimento in un tempo breve di soluzioni mirate al soddisfacimento della clientela.

Obiettivo di questa tesi è la creazione di un ambiente finalizzato alle analisi di marketing mediante l'applicazione di metodi di statistica multivariata ad una tipologia di dati, legati agli acquisti di prodotti di largo consumo effettuati da un campione di famiglie all'interno di alcuni supermercati italiani. Nel presente lavoro di data mining, al fine di segmentare la clientela, viene utilizzata la metodologia della cluster analysis. I dati relativi agli acquisti di prodotti di largo consumo, dati ad hoc procurati con il ricorso all'uso delle carte fedeltà, provengono da 37 negozi di una nota catena della distribuzione organizzata italiana per un periodo di quattro mesi, da gennaio ad aprile 2001. Da questa massa di dati sono stati estratti come campione, mediante una scelta ragionata, quelli riguardanti un solo supermercato della provincia di Lecce. Dapprima vengono analizzati i dati rilevati nei trentasette negozi, allo scopo di costruire un data set completo, ma di semplice lettura e quindi affrontato e risolto il problema dei dati mancanti. In seguito verranno standardizzate le variabili, poiché le loro unità di misura non sono omogenee.

Successivamente si applica il metodo delle componenti principali, che permette di effettuare la classificazione basandosi sui punteggi di tali componenti, o sulle variabili che sono più correlate con le prime componenti principali. A seguire vengono eliminati i dati anomali (outliers) e da ultimo si effettua la cluster analysis vera e propria. I metodi di clusterizzazione si dividono in gerarchici e non gerarchici, con caratteristiche differenti. Mentre i primi producono un numero di gruppi compreso tra uno (tutte le osservazioni insieme in un solo gruppo) e un numero massimo pari al numero delle osservazioni; per i secondi occorre indicare il numero dei clusters desiderati. Si ricorrerà perciò dapprima ai metodi non gerarchici per studiare, attraverso l'esame di opportuni indici statistici, il numero dei gruppi più conveniente; in un secondo tempo, una volta stabilita la partizione ottima, si utilizzerà un metodo non gerarchico considerando il numero dei clusters suggerito dai metodi gerarchici. Il software utilizzato è SAS-BASE con l'ausilio di SAS-INSIGHT; il primo per la stesura dei programmi per la formazione e l'analisi dei data set, il secondo utilizzato per tracciare i grafici.

Da ultimo si traggono alcune conclusioni di tipo economico dall'esame dei valori assunti dalle statistiche delle variabili dei vari clusters, utilizzando anche le informazioni riguardanti l'anagrafica.

 
SAS Academic

The Power to Know
  Sitemap      P.IVA 08517850155     Terms of Use & Legal Information     Privacy Statement    Copyright © 2008 SAS Institute Inc. All Rights Reserved