Прикладная аналитика с применением SAS Enterprise Miner

 


AAEM           Длительность: 3 дня          Уровень: 3          Версия ПО:  14.1          Учебник на русском языке

Версия курса: 08.2016

Этот курс охватывает все необходимые навыки для построения диаграмм для анализа данных с использованием широкого круга инструментов, которые имеются в SAS Enterprise Miner. В курсе рассматриваются задачи поиска шаблонов (сегментирование, ассоциация и анализ последовательности) и прогнозного моделирования (деревья решений, регрессия и нейронные сети). 

Описание курса

В этом курсе изучается:

  • как создать проект для SAS Enterprise Miner и исследовать исходные данные графически
  • как изменить данные для получения лучших результатов анализа
  • как построить и интерпретировать прогнозные модели (такие как деревья решений и регрессионные модели)
  • как сравнивать и объяснять сложные модели
  • как создавать и использовать код для скоринга
  • как проводить поиск ассоциаций и анализ последовательности на примере транзакционных данных

Аналитики данных, эксперты по качеству и другие специалисты, которые используют SAS Enterprise Miner в своей работе.
Для изучения материалов курса необходимо предварительное знакомство с основами математической статистики и статистического моделирования. Опыт работы с системой SAS не требуется, хотя будет желателен.
Желательно, чтобы слушатели:

  • Имели представление об организации данных в системе SAS и об основных процедурах SAS.
  • Умели работать с библиотеками и наборами данных SAS.
  • Понимали логику процессов выполнения шага данных (DATA step).

Введение в SAS Enterprise Miner
Доступ и первичное использование подготовленных данных

  • создание проекта, библиотеки и диаграммы в SAS Enterprise Miner
  • задание источника данных
  • исследование источника данных

Введение в прогнозные модели: деревья решений

  • введение
  • построение деревьев решений
  • оптимизация сложности дерева решений
  • дополнительные инструменты диагностики (самостоятельное изучение)
  • параметры для автономного построения дерева решений (самостоятельное изучение)

Введение в прогнозные модели: регрессия

  • выбор входных переменных регрессии
  • оптимизация сложности регрессии
  • интерпретация регрессии
  • преобразование входных переменных
  • категориальные входные переменные
  • полиномиальная регрессия (самостоятельное изучение)

Введение в прогнозные модели: нейронные сети

  • выбор входных переменных
  • остановка обучения
  • другие инструменты для моделирования (самостоятельное изучение)

Оценка модели

  • статистики подгонки модели
  • статистические графики
  • поправка для раздельных выборок
  • матрицы прибыли

Внедрение модели. Скоринг

  • наборы данных с внутренним скорингом
  • модули скорингового кода

Введение в поиск шаблонов

  • кластерный анализ
  • анализ рыночной корзины (самостоятельное изучение)

Специальные темы

  • ансамбли моделей
  • выбор переменных
  • консолидация категориальных входных переменных
  • заменяющие модели
  • SAS Rapid Predictive Modeler

Тематические исследования

  • сегментирование клиентов банка по истории транзакций
  • анализ ассоциаций на примере данных веб-сервиса
  • создание простой модели кредитных рисков из исторических данных по заёмщикам
  • исследование enrollment management