Flussi ETL efficienti
• elementi chiave nell’utilizzo di SAS Data Integration Studio
• misurare l’efficienza
Tuning dei processi ETL
• gestione di file intermedi
• tabelle fisiche o logiche
• considerazioni sulla qualità dei dati
• trasformazione e ottimizzazione dei dati
• gestione e analisi dello stato dei processi
Gestione dei dati
• chiavi e indici
• funzioni di gestione di righe e colonne
• tecniche di load
Sorts e Join
• gestione di processi con task intensive
• misura delle performance dei sort
• ottimizzazione delle performance nelle join
Modelli dimensionali
• perché uno star schema
• le “slowly changing dimension”
• costruire dimensioni e fact table
• ottimizzazione dei processi con tabelle RDBMS
Ottimizzazione dell'ambiente fisico
• hardware e memoria
• misura delle performance.
|