Построение улучшенных предиктивных моделей с использованием SAS Enterprise Miner

PMAD Длительность: 3 дня Уровень: 4 Версия ПО: 13

Описание курса
Требования к слушателям
Программа

В этом курсе обсуждаются избранные вопросы, касающиеся разработки и оптимизации эффективности предиктивных моделей в SAS Enterprise Miner. В курсе продолжается разработка моделей, которые обсуждаются в курсе «Прикладная аналитика с применением SAS Enterprise Miner Часть 1». В частности, обсуждаются некоторые новые узлы для моделирования, узел “two-stage model” и появившиеся недавно методы для отбора переменных.

Также рассматриваются темы:

Методы сокращения размерности и отбора переменных на основе метода главных компонент, регрессии частичных наименьших квадратов (PLS), регрессии наименьших углов (LAR), регрессии с L1 регуляризацией (LASSO).
Современные высокопроизводительные методы для решения задач прогнозирования на основе опорных векторов (SVM) и ансамблей деревьев решений (random forest).
Комбинированный метод решения задачи многоклассовой классификации в условиях несбалансированной обучающей выборки (PNRule).
Модели прогнозирования инкрементального отклика для задач маркетинга с целевой и контрольной группой (incremental response models).
Вопросы интеграции со сторонними аналитическими решениями на примере R и импорта внешних моделей.

Перед посещением этого курса рекомендуется, чтобы слушатели:

Изучили курс «Прикладная аналитика с применением SAS Enterprise Miner Часть 1».
Знали, как создавать и работать с наборами данных SAS в объёме курса «Основы программирования на языке SAS, часть 1»
Имели некоторый опыт построения статистических моделей с помощью кода и библиотеки SAS/STAT
Знали основы статистики, включающие линейную и логистическую регрессию.

В курсе используется программное обеспечение SAS Enterprise Miner.

Аудитория

Специалисты, занимающиеся построением сложных моделей в Enterprise Miner.

Основы построения предиктивных моделей в SAS Enterprise Miner

Предварительная настройка SAS Enterprise Miner
Основы статистического моделирования
Деревья решений
Регрессионные модели
Нейронные сети
Сравнение моделей

Улучшенные методы для сокращения размерности

Метод главных компонент
PLS-регрессия

Улучшенные методы для выбора интервальных переменных

Кластеризация переменных
LAR/LASSO

Улучшенные методы для выбора номинальных и интервальных переменных

Эмпирический логит
Метод сглаженной весомости признака
Метод всех возможных регрессий (самостоятельное изучение)

Улучшенные предиктивные модели

support vector machines (high performance)
random forest (high performance)
Вывод правил методом индукции
Модели инкрементального отклика (самостоятельное изучение)

Предсказание нескольких целевых переменных

Обобщенные матрицы потерь
Базовые двухуровневые модели
Создание компонентных моделей

Советы

Узел Open Source Integration
Повторное использование метаданных
Импорт и использование внешних моделей (самостоятельное изучение)