Detailní informace o školení

Outline in English Data Cleaning Techniques
Kód BDCT
Název Metody čištění dat
Určení Warehousing
Délka standardně 2 dny, vždy 9-17 hodin (s pauzou na oběd)
Cena
  • 25.000,- Kč
  • 25.000,- Kč pro akademická pracoviště
  • sleva 5% až 20% při dvou a více účastnících z jedné firmy
  • uvedené ceny jsou bez DPH
Místo konání SAS, Na Pankráci 17-19, Praha 4 (3. patro budovy)
Jazyk
  • přednášky - čeština
  • školící materiály - angličtina
V ceně zahrnuto
  • přístup k PC (max. 1 účastník na 1 PC)
  • školící materiály
Doporučené kurzy před PRG1

Kurz určený všem, kteří se chtějí seznámit s nejrůznějšími metodami čištění dat. Při přihlášení do tohoto kurzu by uživatelé již měli mít zkušenosti se SAS System a datastepem (PRG1 + PRG2).

Přínos pro účastníka

Ve školení se naučíte, jak odhalovat a korigovat chyby ve vstupních datech. Mezi techniky patří zejména použití datastepu, ale i procedur FREQ, MEANS a UNIVARIATE, které umožňují identifikovat "problematická" pozorování numerických i kategoriálních proměnných dle předem stanovených kritérií. Další část kurzu je věnována vyhledávání shodných identifikačních znaků v různých souborech (fuzzy join) a vyhledávání duplicitních záznamů.

Obsah kurzu

Úvod

Kontrola hodnot textových proměnných

Kontrola hodnot numerických proměnných

Kontrola chybějících hodnot

Práce s datumy

Vyhledávání duplicit a vícenásobných pozorování

Práce s více soubory

Porovnávání více souborů (procedura COMPARE)

Vybraná SQL řešení pro čištění dat

Vybraná datastep řešení pro čištění dat

Data specifická pro ČR (viz. CZDATA)

Další témata podle zájmu účastníků

Podělte se s námi o vaše nápady! Jsou zde další témata, která vám v kurzu chybí? Chtěli byste kurz uspořádat jinde nebo trochu jinak? Dejte nám o tom vědět na training@cze.sas.com.