SAS
News Partner Academic Opportunitą di Lavoro Contattateci Resource Center
Home Soluzioni e Tecnologie Referenze eventi Supporto Clienti Servizi e Formazione Chi Siamo www.sas.com

un approccio per l'individuazione di gruppi densi di elementi in ambito web usage mining
(A.A. 2003)
Lisa Di Matteo, Università di Trieste - Facoltà di Economia
Relatore: prof.ssa Gabriella Schoier
Correlatore: prof. Giuseppe Melfi

La sempre crescente disponibilità di dati, anche grazie al continuo sviluppo di strumenti hardware e software per la raccolta e l'organizzazione delle risorse, ha fatto emergere la necessità di potre disporre di tecniche adeguate per la loro analisi.

In questo ambito prendiamo in considerazione il Data Mining, ovvero quel processo di estrazione delle informazioni dai dati raccolti in Database di dimensioni elevate e, in particolare, tra le diverse tecniche adottate da tale processo, ci soffermiamo sulla Teoria dei Grafi applicata alle reti di grandi dimensioni aventi per oggetto dati provenienti dall'ambiente Web.

Una rete sociale è un insieme di unità collegate tra loro da un insieme di relazioni di diverso tipo. I metodi statistici classici e quelli di analisi dei dati non sono sufficienti per individuare e analizzare la struttura di queste relazioni, ed è proprio a tale scopo che sono stati introdotti alcuni metodi di concetti differenti. Questi concetti sono formalizzati dalla Teoria dei Grafi e possono essere utilizzati come punto di partenza per una prima analisi della struttura globale delle reti, la quale può essere rappresentata descrivendo il modo in cui si relazionano tra loro sottogruppi di unità, individuati all'interno della rete stessa. I sottogruppi, denominati sottogruppi aderenti, possono essere scoperti utilizzando diversi approcci a seconda della nozione teorica alla quale si riferiscono.

In questa tesi forniamo un metodo, basato sul modello di influenza degli attori simili, per l'identificazione di gruppi di unità fortemente relazionate tra loro, all'interno di una rete di dimensioni elevate, e aventi per oggetto dati derivanti dall'ambito Web Usage Mining.
Il metodo proposto è in grado di riassumere la rete in questione in un insieme di m variabili di posizione, le quali rappresentano la base per l'applicazione di un qualsiasi algoritmo o modello di analisi dei Cluster.

 
SAS Academic

The Power to Know
  Sitemap      P.IVA 08517850155     Terms of Use & Legal Information     Privacy Statement    Copyright © 2008 SAS Institute Inc. All Rights Reserved