Detailní informace o školení
| Outline in English | Using SAS Data Integration Studio to Create Efficient ETL Processes |
| Kód | DITUNE |
| Název | Tvorba efektivních ETL procesů pomocí SAS Data Integration Studio |
| Určení | Warehousing |
| Úroveň | 4 |
| Délka | standardně 2 dny, vždy 9-17 hodin (s pauzou na oběd) |
| Cena |
|
| Místo konání | SAS, Na Pankráci 17-19, Praha 4 (1. patro budovy) |
| Jazyk |
|
| V ceně zahrnuto |
|
| Doporučené kurzy před | DIPROG nebo PRG1, DIS |
V tomto kurzu účastníci získají klíčové znalosti o výkonnosti a možnostech procesů pro načítání dat (ETL procesů) a způsobech jejich ladění a zefektivnění v systému SAS 9 a v aplikaci SAS Data Integration Studio. V kurzu jsou probrány principy ETL procesů a s pomocí názorných příkladů jsou detailně rozebrána témata související s efektivitou při načítání dat.
Před přihlášením by účastníci měli:
- znát základy programování v SAS (v rozsahu školení PRG1)
- ovládat práci s aplikací SAS Data Integration Studio (v rozsahu školení DIS)
- výhodou je znalost makro jazyka SAS (školení MAC1)
Přínos pro účastníka
V kurzu se naučíte:
- analyzovat a odlaďovat ETL procesy
- jednoduše a rychle zvýšit výkonnost načítání
- nakonfigurovat systémové prostředí
- využívat pokročilé techniky pro zvýšení výkonu
Obsah kurzu
Monitorování výkonnosti ETL procesů
- úvod do SAS Intelligence Platform
- základní koncepce aplikace SAS Data Integration Studio
- měření výkonnosti
Základní techniky pro zvýšení výkonnosti ETL procesů
- práce s mezivýstupy
- pohledy (views) versus fyzické tabulky v ETL procesech
- otázka kvality dat
- transformace a nepotřebné sloupce
- kontrola stavu načítání a návratových kódů
Práce s daty
- klíče
- indexy
- datové funkce
- počítání řádků
- techniky plnění
Třídění a spojování
- přehled úloh náročných na zpracování
- zefektivnění procesu třídění
- optimalizace výkonu při spojování (joins)
Dimenzionální modely
- co je star schema
- definice dat nepodléhajících častým změnám (Slowly Changing Dimensions)
- vytvoření dimenzí
- vytvoření faktových tabulek
Práce s relačními databázemi
- optimalizace zpracování dat z relačních databází
Optimalizace prostředí
- úvod
- optimalizace hardwaru a paměti
- sledování výkonu
Další témata podle zájmu účastníků
Podělte se s námi o vaše nápady! Jsou zde další témata, která vám v kurzu chybí? Chtěli byste kurz uspořádat jinde nebo trochu jinak? Dejte nám o tom vědět na training@cze.sas.com.

