 |
un approccio per l'individuazione di gruppi
densi di elementi in ambito web usage mining
(A.A. 2003)
Lisa Di Matteo, Università di Trieste - Facoltà
di Economia
Relatore: prof.ssa Gabriella Schoier
Correlatore: prof. Giuseppe Melfi
La sempre crescente disponibilità di dati, anche
grazie al continuo sviluppo di strumenti hardware e software per la raccolta
e l'organizzazione delle risorse, ha fatto emergere la necessità di
potre disporre di tecniche adeguate per la loro analisi.
In questo ambito
prendiamo in considerazione
il Data Mining, ovvero quel processo di estrazione delle informazioni
dai dati raccolti in Database di dimensioni elevate e, in particolare,
tra le diverse tecniche adottate da tale processo, ci soffermiamo sulla
Teoria dei Grafi applicata alle reti di grandi dimensioni aventi per oggetto
dati provenienti dall'ambiente Web.
Una rete sociale è un insieme di unità collegate tra loro
da un insieme di relazioni di diverso tipo. I metodi statistici classici
e quelli di analisi dei dati non sono sufficienti per individuare e analizzare
la struttura di queste relazioni, ed è proprio a tale scopo che
sono stati introdotti alcuni metodi di concetti differenti. Questi concetti
sono formalizzati dalla Teoria dei Grafi e possono essere utilizzati come
punto di partenza per una prima analisi della struttura globale delle
reti, la quale può essere rappresentata descrivendo il modo in
cui si relazionano tra loro sottogruppi di unità, individuati all'interno
della rete stessa. I sottogruppi, denominati sottogruppi aderenti, possono
essere scoperti utilizzando diversi approcci a seconda della nozione teorica
alla quale si riferiscono.
In questa tesi forniamo un metodo, basato sul modello di influenza degli
attori simili, per l'identificazione di gruppi di unità fortemente
relazionate tra loro, all'interno di una rete di dimensioni elevate, e
aventi per oggetto dati derivanti dall'ambito Web Usage Mining.
Il metodo proposto è in grado di riassumere la rete in questione
in un insieme di m variabili di posizione, le quali rappresentano la base
per l'applicazione di un qualsiasi algoritmo o modello di analisi dei
Cluster.
|
 |
 |
 |
| |
| SAS Academic |
|