
SAS Data Integration Studio. Ускоренный курс
(DIFT)
Длительность: 4 дня. Уровень: 4. Версия ПО: 9.3
Этот интенсивный курс предназначен для ускоренного обучения пользователей, которые будут применять SAS Data Integration Studio. Помимо различных приёмов работы с этой программой, в курсе обсуждаются регистрация исходных и целевых таблиц, создание и работа с заданиями (jobs), работа с трансформациями. В курсе обсуждается работа с медленно меняющимися измерениями, трансформациями внутри цикла (Loop), создание новых трансформаций.
В курсе изучается как
- Регистрировать исходные данные и целевые таблицы
- Создавать задания (jobs) с помощью встроенного редактора заданий (jobs editor)
- Работать со множеством различных трансформаций
- Работать с медленно меняющимися измерениями
- Работать с трансформациями внутри цикла
- Создавать новые трансформации
- Выполнять анализ влияния
- Проводить импорт и экспорт метаданных
- Указывать контрольные точки (checkpoints) в диаграмме задания (job flow)
- Развертывать процессы для регулярного запуска
- Развертывать процессы в виде хранимых процессов SAS
Сертификация:
Данный курс помогает подготовиться к сертификационному экзамену SAS Data Integration Developer.
Для прохождения этого курса слушателям необходимо получить опыт в программировании на языке SAS и SAS Macro, а также быть знакомыми с языком запросов SQL. Эти навыки можно приобрести на курсах Программирование на языке SAS. Часть 1: Основы, SAS SQL1: Essentials, SAS Macro Language 1: Essentials
Аудитория
Курс рассчитан на специалистов, которые занимаются интеграцией данных.
Введение
- Платформа SAS Business Analytics
- Приложения для интеграции данных
- Управление изменениями (Change management)
Программа курса и учебные данные
- Исследование рабочего окружения и данных для курса
- Самостоятельные задания
Создание метаданных для исходных данных
- Настройка рабочего окружения
- Регистрация метаданных для исходных таблиц SAS
- Регистрация метаданных для исходных таблиц Oracle
- Регистрация метаданных для исходных данных ODBC
- Регистрация метаданных для внешних файлов
Создание метаданных для целевых данных
- Регистрация метаданных для целевых данных
- Импорт метаданных
Создание метаданных для заданий (jobs)
- Введение в задания (jobs) и редактор заданий (jobs editor)
- Использование трансформации (Join)
Учебный пример: Orion Star
- Определение и загрузка некоторых таблиц с измерениями
- Определение вычисляемых столбцов
- Работа с трансформацией «Соединение»
- Работа с трансформацией «Загрузка таблиц» и «Пользовательский код»
Дополнительные возможности для заданий (jobs)
- Импорт программы SAS
- Мэппинг и распространение
- Создание цепочки процессов
- Исследование производительности
- Изучение предопределённых отчетов о метаданных (самостоятельное изучение)
Работа с трансформациями
- Использование трансформаций «Extract» и «Summary Statistics»
- Трансформация «SQL»
- Обработка статусов
- Использование трансформации «проверка данных» («Data Validation»)
- Трансформации транспонирование («Transpose»), сортировка («Sort»), объединение («Append»), ранг («Rank»), листинг данных (“List Data”)
- Использование трансформаций «Apply Lookup Standardization», «Standardize with Definition» и «One-Way Frequency» (Самостоятельное изучение)
Работа с трансформацией Loop
- Введение
- Использование трансформаций внутри цикла для итеративной обработки в задании
- Использование трансформаций внутри цикла для итеративной обработки одной трансформации (самостоятельное изучение)
Работа с медленно меняющимися измерениями
- Определение медленно меняющихся измерений
- Использование трансформации для загрузки медленно меняющегося измерения 2-го типа (SCD Type 2) и трансформации «Lookup»
- Использование трансформации для загрузки медленно меняющегося измерения 2-го типа
- Введение в трансформацию «Change Data Capture» (самостоятельное изучение)
Создание пользовательских трансформаций
- Изучение шаблонов трансформации SAS Code
- Использование мастера настроек трансформации
Работа с трансформациями Table loader
- Изучение основ трансформации Table loader
- Изучение вариантов загрузки, доступных в трансформации Table loader
- Управление индексами и целостностью данных во время загрузки
- Изучение пакетной загрузки (bulk loading) в СУБД
Работа с базами данных (самостоятельное изучение)
- Введение в in-Database обработку
- Использование обработки in-Database
- Изучение обработки ELT
- Использование функций Oracle
Дополнительные темы для пользователей SAS Data Integration Studio
- Анализ метаданных с помощью анализа влияния
- Сравнение таблиц
- Изучение переноса метаданных
- Изучение контроля версий
- Создание контрольных точек
Развёртывание заданий (jobs)
- Введение
- Развёртывание заданий для запуска по регламенту
- Развёртывание заданий из командной строки
- Развёртывание заданий в виде хранимых процессов