Školení / Čištění dat pomocí technologie DataFlux v kostce

Detailní informace o školení

Outline in English Data Quality Using DataFlux Technology: Fast Track
Kód DQFT82 (dříve DQFT)
Název Čištění dat pomocí technologie DataFlux v kostce
Určení Warehousing
Úroveň 4
Délka standardně 5 dnů, vždy 9-17 hodin (s pauzou na oběd)
Cena
  • 29.930,- Kč
  • 12.095,- Kč pro akademická pracoviště
  • sleva 5% až 20% při dvou a více účastnících z jedné firmy
  • uvedené ceny jsou bez DPH
Místo konání SAS, Na Pankráci 17-19, Praha 4 (3. patro budovy)
Jazyk
  • přednášky - čeština
  • školící materiály - angličtina
V ceně zahrnuto
  • přístup k PC (max. 1 účastník na 1 PC)
  • školící materiály

Tento intenzívní pětidenní kurz je určen zájemcům o získání praktických informací v oblasti DataFluxu a data managementu. Účastníci se naučí jak pomocí DataFlux dfPower Studio zlepšit svá data pomocí metod zkvalitňování, integrace a obohacování dat. Probírán bude také DataFlux Integration Server, obzvláště vzdálené zpracování jobů a zřízení real-time služeb. Dále bude použit nástroj dfPower Customize pro zkoumání Quality Knowledge Base (QKB) komponentů, typů dat a definicí. Jedná se o zrychlený kurz poskytující velké množství informací v krátkém čase (pro zájemce o velmi detailní a pomalejší poznání konkrétních DQ nástrojů jsou k dispozici specializované kurzy).

Přínos pro účastníka

V kurzu se naučíte:

  • profilovat data
  • vylepšovat data aplikováním různých technik čištění dat
  • provádět verifikaci adres
  • kontrolovat proces čištění dat pomocí trendové analýzy a nastavení business pravidel pro monitoring
  • konfigurovat DataFlux Integration Server
  • zpracovávat joby vzdáleným přístupem
  • zřídit real-time služby
  • rozumět komponentům QKB
  • používat editor QKB komponentů
  • rozumět různým definicím

Obsah kurzu

Přehled o dfPower Studio

  • instalace a architektura produktů DataFlux
  • dfPower Studio
  • další komponenty a datové přístupy

DataFlux metodologie: Analýza

  • co je profilování dat/metadat?
  • profilování s dfPower Explorer
  • profilování s dfPower Profile

Úvod do dfPower Architect

  • co je dfPower Architect
  • práce s dfPower Architect

DataFlux metodologie: Kvalita

  • přehled technik datové kvality
  • detaily technik datové kvality
  • standardizace
  • další techniky

DataFlux metodologie: Integrace

  • přehled technik datové integrace
  • detaily technik datové integrace
  • techniky přiřazování

DataFlux metodologie: Obohacování

  • přehled technik datového obohacování
  • detaily technik datového obohacování
  • verifikace adres

DataFlux metodologie: Kontrolní fáze

  • přehled kontrolní fáze
  • trendová analýza a upozornění
  • monitoring business pravidel

Další možnosti dfPower Studio

  • práce s dalšími uzly dfPower architekta
  • dávkové zpracování (samostudium)
  • práce s makro proměnnými (samostudium)
  • práce s vlastními metrikami (samostudium)

Úvod do DataFlux Integration Server

  • příklady využití DataFlux Integration Server
  • konfigurace

Vzdálené zpracovávání jobů

  • dfPower Architekt job
  • uploadování jobů na DataFlux Integration Server
  • zpracování na dalším DataFlux Integration Server

Real-time služby

  • vytvoření služby
  • interakce mezi službami

Úvod do přizpůsobování QKB

  • úvod
  • struktura QKB
  • editory komponent

Definice

  • "parse" definice
  • "match" definice
  • standardizované definice

Další definice

  • "case" definice
  • "gender analysis" definice
  • "identification" definice
  • "pattern analysis" definice

Tvorba nového typu dat (samostudium)

Další témata podle zájmu účastníků

Podělte se s námi o vaše nápady! Jsou zde další témata, která vám v kurzu chybí? Chtěli byste kurz uspořádat jinde nebo trochu jinak? Dejte nám o tom vědět na training@cze.sas.com.