 |
Metodi statistici
per la classificazione comportamentale delle carte fedeltà.
Alessandra Corradino, Facoltà di Economia
Relatore:
prof. Paolo Giudici
L'utilizzo della cluster analysis consente di classificare le unità statistiche
al fine di formare gruppi il più possibile omogenei al loro interno ed eterogenei
tra di loro, mettendo in evidenza le caratteristiche che accomunano gli elementi
di uno stesso gruppo e rendono ciascuno di essi distinto dagli altri. Questo
tipo di analisi presenta il vantaggio di ridurre le dimensioni dei dati da analizzare:
dal numero totale di unità statistiche al numero dei clusters. Si tratta di un
metodo di indagine parzialmente soggettivo nel quale le scelte da compiere sono
lasciate alla competenza del ricercatore, per il quale ogni decisione è condizionata
dall'obiettivo finale; si tratta anche di un metodo esplorativo, che dà risultati
positivi per l'interpretazione dei gruppi solo se questi sono già esistenti,
anche se non evidenti, nella popolazione osservata. La classificazione di una
popolazione permette così di identificare le caratteristiche dei diversi gruppi.
Per questo motivo l'impiego di tale metodologia è di grande rilevanza per le
aziende che, mediante le conclusioni tratte dalla applicazione della cluster
analysis, possono definire le strategie di mercato al fine di conseguire un vantaggio
competitivo all'interno del settore in cui esse operano, con la ricerca e l'ottenimento
in un tempo breve di soluzioni mirate al soddisfacimento della clientela.
Obiettivo di questa tesi è la creazione di un ambiente finalizzato alle analisi
di marketing mediante l'applicazione di metodi di statistica multivariata ad
una tipologia di dati, legati agli acquisti di prodotti di largo consumo effettuati
da un campione di famiglie all'interno di alcuni supermercati italiani. Nel presente
lavoro di data mining, al fine di segmentare la clientela, viene utilizzata la
metodologia della cluster analysis. I dati relativi agli acquisti di prodotti
di largo consumo, dati ad hoc procurati con il ricorso all'uso delle carte fedeltà,
provengono da 37 negozi di una nota catena della distribuzione organizzata italiana
per un periodo di quattro mesi, da gennaio ad aprile 2001. Da questa massa di
dati sono stati estratti come campione, mediante una scelta ragionata, quelli
riguardanti un solo supermercato della provincia di Lecce. Dapprima vengono analizzati
i dati rilevati nei trentasette negozi, allo scopo di costruire un data set completo,
ma di semplice lettura e quindi affrontato e risolto il problema dei dati mancanti.
In seguito verranno standardizzate le variabili, poiché le loro unità di misura
non sono omogenee.
Successivamente si applica il metodo delle componenti principali, che permette
di effettuare la classificazione basandosi sui punteggi di tali componenti, o
sulle variabili che sono più correlate con le prime componenti principali. A
seguire vengono eliminati i dati anomali (outliers) e da ultimo si effettua la
cluster analysis vera e propria. I metodi di clusterizzazione si dividono in
gerarchici e non gerarchici, con caratteristiche differenti. Mentre i primi producono
un numero di gruppi compreso tra uno (tutte le osservazioni insieme in un solo
gruppo) e un numero massimo pari al numero delle osservazioni; per i secondi
occorre indicare il numero dei clusters desiderati. Si ricorrerà perciò dapprima
ai metodi non gerarchici per studiare, attraverso l'esame di opportuni indici
statistici, il numero dei gruppi più conveniente; in un secondo tempo, una volta
stabilita la partizione ottima, si utilizzerà un metodo non gerarchico considerando
il numero dei clusters suggerito dai metodi gerarchici. Il software utilizzato è SAS-BASE
con l'ausilio di SAS-INSIGHT; il primo per la stesura dei programmi per la formazione
e l'analisi dei data set, il secondo utilizzato per tracciare i grafici.
Da ultimo
si traggono alcune conclusioni di tipo economico dall'esame dei valori assunti
dalle statistiche delle variabili dei vari clusters, utilizzando anche le informazioni
riguardanti l'anagrafica.
|
 |
 |
 |
| |
| SAS Academic |
|