DataFlux Data Management Studio: ускоренный курс
(DQ24DMFT)
Длительность: 4 дня. Уровень: 4.
Данный курс вобрал в себя основную часть материалов, изложенных в курсах DataFlux Data Management Studio: Basics и DataFlux Data Management Studio: Advanced. В рамках курса слушатели знакомятся с DataFlux Data Management Studio и изучают как исследовать и профилировать данные, формировать задания для управления данными (такие как задачи по улучшению качества данных и устранению дубликатов), использовать мониторинг данных, как пользоваться языком DataFlux Expression Engine, создавать пользовательские метрики, макропеременные и интеграционные процессы.
Слушатели этого курса научатся
- Исследовать данные и использовать результаты исследований;
- Профилировать данные и применять результаты;
- Создавать интеграционные потоки (data jobs) и встраивать в них шаги по улучшению данных;
- Настраивать мониторинг данных;
- Работать с встроенным языком DataFlux Expression Engine;
- Создавать и использовать пользовательские метрики качества данных;
- Определять и использовать макропеременные;
- Создавать интеграционные процессы (process jobs).
Специальных навыков не требуется.
Введение в методологию DataFlux и структуру курса
- Введение в архитектуру интеграционной платформы DataFlux Data Management
- Структура курса
DataFlux Data Management Studio: начало работы
- Введение в интерфейс DataFlux Data Management Studio
- Понятие связности данных
Работа на фазе PLAN (Планирование) методологии DataFlux
- Создание коллекций данных
- Исследование данных (data explorations)
- Профилирование данных
- Разработка схем стандартизации данных
Работа на фазе ACT(Действие) методологии DataFlux
- Введение в понятие интеграционных потоков
- Работа с шагами улучшения качества данных, включая Стандартизацию данных, Обогащение информации и Парсинг
- Построение процессов дедупликации данных и построения «Золотой записи», включающие в себя узлы построения матч-кодов, Кластеризации и Поиск «Золотой записи».
Работа на фазе MONITOR(Мониторинг) методологии DataFlux
- Введение в понятие бизнес-правил и знакомство с Business Rules Manager
- Использование бизнес-правил и уведомлений в профилировании данных
- Использование бизнес-правил в интеграционных потоках
- Создание интеграционных потоков для мониторинга данных
Язык DataFlux Expression Engine (EEL)
- Введение в язык DataFlux Expression Engine
- Профилирование данных с помощью EEL
- Работа с узлом «expression» в потоках данных: операторы IF/ELSE
- Работа с узлом «expression» в потоках данных: оператор RETURN
Пользовательские метрики и макросы
- Создание и работа с пользовательскими метриками
- Создание и работа с пользовательскими макропеременными
Интеграционные процессы
- Введение в Интеграционные процессы
- Использование переменных в Интеграционных процессах
- Работа с условными переменными, временными таблицами и событиями
Советы и приёмы работы
- Исследуем как данные обрабатываются в Интеграционном потоке
- Обсуждение вопросов оптимизации потоков
- Советы по созданию и тестированию потоков
- Проблемы, связанные с переносом процессов и потоков на промышленные среды