Построение улучшенных предиктивных моделей с использованием SAS Enterprise Miner

 


PMAD            Длительность: 3 дня            Уровень: 4            Версия ПО:  13

В этом курсе обсуждаются избранные вопросы, касающиеся разработки и оптимизации эффективности предиктивных моделей в SAS Enterprise Miner. В курсе продолжается разработка моделей, которые обсуждаются в курсе «Прикладная аналитика с применением SAS Enterprise Miner Часть 1». В частности, обсуждаются некоторые новые узлы для моделирования, узел “two-stage model” и появившиеся недавно методы для отбора переменных.

Также рассматриваются темы:

  1. Методы сокращения размерности и отбора переменных на основе метода главных компонент, регрессии частичных наименьших квадратов (PLS), регрессии наименьших углов (LAR), регрессии с L1 регуляризацией (LASSO).
  2. Современные высокопроизводительные методы для решения задач прогнозирования на основе опорных векторов (SVM) и ансамблей деревьев решений (random forest).
  3. Комбинированный метод решения задачи многоклассовой классификации в условиях несбалансированной обучающей выборки (PNRule).
  4. Модели прогнозирования инкрементального отклика для задач маркетинга с целевой и контрольной группой (incremental response models).
  5. Вопросы интеграции со сторонними аналитическими решениями на примере R и импорта внешних моделей.

Перед посещением этого курса рекомендуется, чтобы слушатели:

В курсе используется программное обеспечение SAS Enterprise Miner.

Аудитория

Специалисты, занимающиеся построением сложных моделей в Enterprise Miner.

Основы построения предиктивных моделей в SAS Enterprise Miner

  • Предварительная настройка SAS Enterprise Miner
  • Основы статистического моделирования
  • Деревья решений
  • Регрессионные модели
  • Нейронные сети
  • Сравнение моделей

Улучшенные методы для сокращения размерности

  • Метод главных компонент
  • PLS-регрессия

Улучшенные методы для выбора интервальных переменных

  • Кластеризация переменных
  • LAR/LASSO

Улучшенные методы для выбора номинальных и интервальных переменных

  • Эмпирический логит
  • Метод сглаженной весомости признака
  • Метод всех возможных регрессий (самостоятельное изучение)

Улучшенные предиктивные модели

  • support vector machines (high performance)
  • random forest (high performance)
  • Вывод правил методом индукции
  • Модели инкрементального отклика (самостоятельное изучение)

Предсказание нескольких целевых переменных

  • Обобщенные матрицы потерь
  • Базовые двухуровневые модели
  • Создание компонентных моделей

Советы

  • Узел Open Source Integration
  • Повторное использование метаданных
  • Импорт и использование внешних моделей (самостоятельное изучение)