Programování v SAS: Pokročilé techniky
| Kód |
PROG3 |
| Název |
Programování v SAS: Pokročilé techniky
|
| Určení |
Programování SAS |
| Úroveň |
4 |
| Délka |
standardně 3 dny, vždy 9-17 hodin (s pauzou na oběd)
|
| Cena |
- 18.225,- Kč
- 7.425,- Kč pro akademická pracoviště
- sleva 5% až 20% při dvou a více účastnících z jedné firmy
- uvedené ceny jsou bez DPH
|
| Místo konání |
SAS, Na Pankráci 17-19, Praha 4 (1. patro budovy) |
| Jazyk |
- přednášky - čeština
- školící materiály - angličtina
|
| V ceně zahrnuto |
- přístup k PC (max. 1 účastník na 1 PC)
- školící materiály
|
| Doporučené kurzy před |
PROG1, PROG2 |
| Navazující kurzy |
EFFI, MPDP |
| Postupy školení |
|
| Online verze |
Life Web
|
Kurz je určený pro velmi pokročilé uživatele, kteří si chtějí prohloubit znalosti programování v SAS.
Účastníci by měli mít minimálně devítiměsíční praxi se SAS System a absolutorium kurzu PROG2
(Programování v SAS: Manipulace s daty), tedy:
- znát nejpoužívanější datové formáty a způsoby přístupu k souborům
- rozumět logice programování
- mít podrobnou znalost datastepu, fáze kompilace a fáze provádění
- umět používat různé způsoby importu externích souborů
- používat knihovny SAS
- pracovat s datumovými hodnotami
- načítat, slučovat, spojovat a prokládat datasety
- používat volby DROP=, KEEP= a RENAME=
- vytvářet více výstupních tabulek najednou
- umět iterativně zpracovávat data pomocí DO smyček a polí
- používat funkce pro manipulace a transformace dat
Přínos pro účastníka
Cílem kurzu je seznámit uživatele s rozšířenými možnostmi manipulace a transformace dat, s metodami vyhledávání a spojování pomocí hashovacích tabulek, multidimenzionálních polí a permanentních uživatelsky definovaných formátů, s efektivním tříděním a indexováním dat, s best practices pro optimální využití paměťové, diskové a CPU kapacity počítače a s použitím SPDE (SAS Scalable Performance
Data Engine), který je nyní součástí Base SAS. Absolvent tohoto školení
by měl být schopen optimalizovat a pracovat efektivně s velkými objemy dat. Kurz je kombinací předchozího PROG3 a kurzu EFFI.
Obsah kurzu
Úvod
- jak měřit efektivitu - benchmarking
- zpracování v SASu
- řízení spotřeby operační paměti a I/O zdrojů
Výběr pozorování
- vytváření vzorků
- vytváření a udržování indexů
Horizontální slučování souborů
- spojování tabulek podle hodnot
- spojování dat na různém stupni agregace
- využití indexů při spojování
- update dat
- spojování dat na různém stupni agregace pomocí dvou příkazů SET
Vertikální slučování souborů
- připojování SAS datasetů
- připojování textových souborů
Zpracování po skupinách (BY-GROUP Processing)
- eliminace duplicit
- zdroje pro třídění
- volba správné rutiny pro třídění
- alternativy ke třídění
Použití vyhledávacích tabulek pro spojení dat
- použití polí jako indexů
- použití hash objektů pro vyhledávání
- použití formátů pro vyhledávání
- vytvoření vyhledávací tabulky transpozicí dat
Řízení objemu dat
- omezení délky numerických proměnných
- koprese datových souborů
- vytváření pohledů (views) pomocí data stepu
Best practices pro vyšší efektivitu
- provádění pouze nutných příkazů
- eliminace zbytečných průchodů daty
- čtení a zápis pouze relevantních dat
- efektivita v síťovém provozu
Použití SPDE - Scalable Performance Data Engine
- vytváření tabulek pomocí SPD enginu
- používání SPD enginu efektivně
- volby příkazu LIBNAME pro SPD engine
Pokročilá témata
- modifikace tabulek (in place)
- verzování tabulek
- integritní omezení
- auditování změn
- práce s regulárními výrazy Perl
Další témata podle zájmu účastníků
Podělte se s námi o vaše nápady! Jsou zde další témata, která vám v kurzu chybí?
Chtěli byste kurz uspořádat jinde nebo trochu jinak? Dejte nám o tom vědět na
training@cze.sas.com.