 |
Il text
mining per l’analisi
di siti web: considerazioni e un’applicazione al settore bancario
Uso di SAS Text Miner
Norma Sanga, Facoltà di Economia
Relatore: prof. Silvia Biffignandi
L’importanza e la diffusione di siti Web aziendali è ormai ampia
e crescente; il sito aziendale diviene un importante strumento di informazione
e di comunicazione con clienti e fornitori è perciò sempre più indispensabile
per l’azienda valorizzare questo strumento ed acquisire la consapevolezza
di un utilizzo dello stesso come uno dei vari elementi della strategia aziendale.
Il text mining è lo strumento statistico che può consentire di
analizzare le caratteristiche dei siti aziendali in un’ottica di analisi
esplorativa dei dati a supporto delle decisioni.
Il presente lavoro illustra uno studio effettuato su siti di alcune principali
banche italiane appartenenti ai maggiori gruppi finanziari presenti sul nostro
mercato. In particolare, l’analisi è indirizzata verso le pagine
di presentazione (“chi siamo”) degli istituti stessi. Il data set
oggetto d’analisi è stato creato scaricando il contenuto delle pagine
relative al ‘Chi siamo’ (pagine madre) di varie banche (nello specifico
28 banche) ed i relativi link con una profondità di due livelli. Lo scopo è di
determinare le caratteristiche di ciascun sito e di valutare come gli istituti
sfruttano il Web.
Le fasi seguite sono: a) determinazione del data
set di input; b) configurazione del nodo di Text Miner per analizzare
i testi e riduzione delle
dimensione dei termini per documento;c) clustering dei documenti.
L’analisi,
infatti, è realizzata mediante applicazione della cluster analysis, attraverso
la quale si sono individuati 6 comportamenti aziendali omogenei in relazione
all’utilizzo di questo strumento di comunicazione e di cui nel lavoro si
propone la definizione e interpretazione.
L’esperienza mostra le buone potenzialità dello strumento statistico
adottato sia dal punto di vista dell’identificazione di gruppi comportamentali
significativi sia dal punto di vista della capacità di identificazione
di informazioni non rilevanti in relazione ai comportamenti di comunicazione, è infatti
sintomatico al proposito il fatto che si sono individuati anche dei cluster che
abbiamo definito di outlier. Al termine del lavoro sono anche esaminati ulteriori
approfondimenti di ricerca che si intendono attuare.
Per l’implementazione è stato utilizzato il prodotto di SAS Text
Miner V 8.2; il progetto è stato realizzato in collaborazione con SAS.
|
 |
 |
 |
| |
| SAS Academic |
|