Прикладная аналитика с применением SAS Enterprise Miner
AAEM Длительность: 3 дня Уровень: 3 Версия ПО: 14.1 Учебник на русском языке
Версия курса: 08.2016
Этот курс охватывает все необходимые навыки для построения диаграмм для анализа данных с использованием широкого круга инструментов, которые имеются в SAS Enterprise Miner. В курсе рассматриваются задачи поиска шаблонов (сегментирование, ассоциация и анализ последовательности) и прогнозного моделирования (деревья решений, регрессия и нейронные сети).
Описание курса
В этом курсе изучается:
- как создать проект для SAS Enterprise Miner и исследовать исходные данные графически
- как изменить данные для получения лучших результатов анализа
- как построить и интерпретировать прогнозные модели (такие как деревья решений и регрессионные модели)
- как сравнивать и объяснять сложные модели
- как создавать и использовать код для скоринга
- как проводить поиск ассоциаций и анализ последовательности на примере транзакционных данных
Аналитики данных, эксперты по качеству и другие специалисты, которые используют SAS Enterprise Miner в своей работе.
Для изучения материалов курса необходимо предварительное знакомство с основами математической статистики и статистического моделирования. Опыт работы с системой SAS не требуется, хотя будет желателен.
Желательно, чтобы слушатели:
- Имели представление об организации данных в системе SAS и об основных процедурах SAS.
- Умели работать с библиотеками и наборами данных SAS.
- Понимали логику процессов выполнения шага данных (DATA step).
Введение в SAS Enterprise Miner
Доступ и первичное использование подготовленных данных
- создание проекта, библиотеки и диаграммы в SAS Enterprise Miner
- задание источника данных
- исследование источника данных
Введение в прогнозные модели: деревья решений
- введение
- построение деревьев решений
- оптимизация сложности дерева решений
- дополнительные инструменты диагностики (самостоятельное изучение)
- параметры для автономного построения дерева решений (самостоятельное изучение)
Введение в прогнозные модели: регрессия
- выбор входных переменных регрессии
- оптимизация сложности регрессии
- интерпретация регрессии
- преобразование входных переменных
- категориальные входные переменные
- полиномиальная регрессия (самостоятельное изучение)
Введение в прогнозные модели: нейронные сети
- выбор входных переменных
- остановка обучения
- другие инструменты для моделирования (самостоятельное изучение)
Оценка модели
- статистики подгонки модели
- статистические графики
- поправка для раздельных выборок
- матрицы прибыли
Внедрение модели. Скоринг
- наборы данных с внутренним скорингом
- модули скорингового кода
Введение в поиск шаблонов
- кластерный анализ
- анализ рыночной корзины (самостоятельное изучение)
Специальные темы
- ансамбли моделей
- выбор переменных
- консолидация категориальных входных переменных
- заменяющие модели
- SAS Rapid Predictive Modeler
Тематические исследования
- сегментирование клиентов банка по истории транзакций
- анализ ассоциаций на примере данных веб-сервиса
- создание простой модели кредитных рисков из исторических данных по заёмщикам
- исследование enrollment management