Worldwide Contacts

If you don't find your country in the list, see our worldwide contacts in:

Africa | Asia/Pacific | Europe | Latin America & Caribbean | Middle East | North America

Il text mining per l’analisi di siti web: considerazioni e un’applicazione al settore bancario
Uso di SAS Text Miner

Norma Sanga, Facoltà di Economia
Relatore: prof. Silvia Biffignandi

L’importanza e la diffusione di siti Web aziendali è ormai ampia e crescente; il sito aziendale diviene un importante strumento di informazione e di comunicazione con clienti e fornitori è perciò sempre più indispensabile per l’azienda valorizzare questo strumento ed acquisire la consapevolezza di un utilizzo dello stesso come uno dei vari elementi della strategia aziendale. Il text mining è lo strumento statistico che può consentire di analizzare le caratteristiche dei siti aziendali in un’ottica di analisi esplorativa dei dati a supporto delle decisioni.

Il presente lavoro illustra uno studio effettuato su siti di alcune principali banche italiane appartenenti ai maggiori gruppi finanziari presenti sul nostro mercato. In particolare, l’analisi è indirizzata verso le pagine di presentazione (“chi siamo”) degli istituti stessi. Il data set oggetto d’analisi è stato creato scaricando il contenuto delle pagine relative al ‘Chi siamo’ (pagine madre) di varie banche (nello specifico 28 banche) ed i relativi link con una profondità di due livelli. Lo scopo è di determinare le caratteristiche di ciascun sito e di valutare come gli istituti sfruttano il Web.

Le fasi seguite sono: a) determinazione del data set di input; b) configurazione del nodo di Text Miner per analizzare i testi e riduzione delle dimensione dei termini per documento;c) clustering dei documenti.

L’analisi, infatti, è realizzata mediante applicazione della cluster analysis, attraverso la quale si sono individuati 6 comportamenti aziendali omogenei in relazione all’utilizzo di questo strumento di comunicazione e di cui nel lavoro si propone la definizione e interpretazione.

L’esperienza mostra le buone potenzialità dello strumento statistico adottato sia dal punto di vista dell’identificazione di gruppi comportamentali significativi sia dal punto di vista della capacità di identificazione di informazioni non rilevanti in relazione ai comportamenti di comunicazione, è infatti sintomatico al proposito il fatto che si sono individuati anche dei cluster che abbiamo definito di outlier. Al termine del lavoro sono anche esaminati ulteriori approfondimenti di ricerca che si intendono attuare.

Per l’implementazione è stato utilizzato il prodotto di SAS Text Miner V 8.2; il progetto è stato realizzato in collaborazione con SAS.

 
SAS Academic