Školení / Tvorba efektivních ETL procesů pomocí SAS Data Integration Studio

Detailní informace o školení

Outline in English Using SAS Data Integration Studio to Create Efficient ETL Processes
Kód DITUNE
Název Tvorba efektivních ETL procesů pomocí SAS Data Integration Studio
Určení Warehousing
Úroveň 4
Délka standardně 2 dny, vždy 9-17 hodin (s pauzou na oběd)
Cena
  • 13.870,- Kč
  • 5.605,- Kč pro akademická pracoviště
  • sleva 5% až 20% při dvou a více účastnících z jedné firmy
  • uvedené ceny jsou bez DPH
Místo konání SAS, Na Pankráci 17-19, Praha 4 (3. patro budovy)
Jazyk
  • přednášky - čeština
  • školící materiály - angličtina
V ceně zahrnuto
  • přístup k PC (max. 1 účastník na 1 PC)
  • školící materiály
Doporučené kurzy před DIPROG nebo PRG1, DIS

V tomto kurzu účastníci získají klíčové znalosti o výkonnosti a možnostech procesů pro načítání dat (ETL procesů) a způsobech jejich ladění a zefektivnění v systému SAS 9 a v aplikaci SAS Data Integration Studio. V kurzu jsou probrány principy ETL procesů a s pomocí názorných příkladů jsou detailně rozebrána témata související s efektivitou při načítání dat.

Před přihlášením by účastníci měli:

  • znát základy programování v SAS (v rozsahu školení PRG1)
  • ovládat práci s aplikací SAS Data Integration Studio (v rozsahu školení DIS)
  • výhodou je znalost makro jazyka SAS (školení MAC1)

Přínos pro účastníka

V kurzu se naučíte:

  • analyzovat a odlaďovat ETL procesy
  • jednoduše a rychle zvýšit výkonnost načítání
  • nakonfigurovat systémové prostředí
  • využívat pokročilé techniky pro zvýšení výkonu

Obsah kurzu

Monitorování výkonnosti ETL procesů

  • úvod do SAS Intelligence Platform
  • základní koncepce aplikace SAS Data Integration Studio
  • měření výkonnosti

Základní techniky pro zvýšení výkonnosti ETL procesů

  • práce s mezivýstupy
  • pohledy (views) versus fyzické tabulky v ETL procesech
  • otázka kvality dat
  • transformace a nepotřebné sloupce
  • kontrola stavu načítání a návratových kódů

Práce s daty

  • klíče
  • indexy
  • datové funkce
  • počítání řádků
  • techniky plnění

Třídění a spojování

  • přehled úloh náročných na zpracování
  • zefektivnění procesu třídění
  • optimalizace výkonu při spojování (joins)

Dimenzionální modely

  • co je star schema
  • definice dat nepodléhajících častým změnám (Slowly Changing Dimensions)
  • vytvoření dimenzí
  • vytvoření faktových tabulek

Práce s relačními databázemi

  • optimalizace zpracování dat z relačních databází

Optimalizace prostředí

  • úvod
  • optimalizace hardwaru a paměti
  • sledování výkonu

Další témata podle zájmu účastníků

Podělte se s námi o vaše nápady! Jsou zde další témata, která vám v kurzu chybí? Chtěli byste kurz uspořádat jinde nebo trochu jinak? Dejte nám o tom vědět na training@cze.sas.com.