 |
algoritmi associativi per il web usage mining:
proposte e confronti
(luglio 2004)
Paolo Baldini, Università di Pavia - Facoltà di Ingegneria
Relatore: prof. Giuseppe De Nicolao
Correlatore: prof. Paolo Giudici
Lo scopo della ricerca è stato quello di analizzare
gli sviluppi degli algoritmi associativi per ovviare al costante aumento
delle dimensioni dei dataset causato dalla crescente informatizzazione
dei processi aziendali e non.
Si sono messi a confronto, dove si è potuto, i costi in termini
di spazio di memoria, e di tempo di esecuzione dell'algoritmo di Apriori,
di Backtracking e GenMax.
Tra l'algoritmo Apriori e qeullo di Backtracking si è avuto il
passaggio tra gli algoritmi di tipo level-wise, che analizzno completamente
un livello prima di passare al successivo, ad algoritmi di tipo depth-first
che utlizzano una struttura da albero per attraversare i diversi stati.
Al crescere del numero di variabili il numero di nodi è diventato
sempre più proibitivo, si è arrivati quindi a studiare metodologie
per sfoltire al massimo questi alberi di ricerca, e uno di questi metodi è proprio
l'algoritmo GenMax.
Si è scelto poi di applicare ai risultati dell'algoritmo GenMax
un argomento di crescente attualità, il Web Usag Mining, che sta
assumendo sempre più improtanza grazie al costante aumento del
valore economico-comemrciale di Internet.
Come possono essere applicati i risultati degli algoritmi associativi
a questo scopo? Gli algoritmi associativi sono sempre stati usati per
individuare relazioni all'interno dei transazioni che permettessero di
caratterizzare le diverse tipologie di scelta degli individui, ma all'interno
del sito esistono relazioni (i link) tra le variabili che non sempre sono
presenti in altri campi di applicazione.
Con un semplice accorgimento è stato
possibile adattare questi algoritmi a questo tipo di relazioni, in modo
da rendere più facile l'interpretazione e la ricerca dei risultati
finali. Si è ricavato in questo modo che gli algoritmi associativi
sono anche in questo caso un buon strumento di analisi per individuare
quanto la struttura di un sito si adatti meglio a quelle che sono le scelte
e le richieste dei visitatori, permettendo anche attraverso i risultati
dell'algoritmo GenMax di prendere delle decisioni a priori sulle conclusioni
che potremo ottenere.
|
 |
 |
 |
| |
| SAS Academic |
|