Моделирование с помощью деревьев принятия решений
(DMDT71)

Длительность: 2 дня.                Уровень: 4.               Версия ПО:   9.3

В этом курсе изучается построение древовидных предсказательных статистических моделей и методология для построения деревьев решений, регулирования их глубины и оценки их качества. Дополнительно в курсе обсуждаются различные варианты использования деревьев – исследовательский анализ данных, сокращение размерности, импутация пропущенных значений.

Слушатели этого курса научатся:

  • Строить древовидные модели, в том числе деревья классификации и деревья регрессии
  • Использовать методологию для построения деревьев принятия решений, регулирования их глубины и оценки их качества
  • Использовать деревья принятия решений для исследования данных, сокращения размерности моделей и импутации пропущенных значений

Для прохождения этого курса вам нужно знать основные статистические понятия. Эти навыки вы можете получить на курсе Statictics 1: Introduction to ANOVA, Regression and Logistic Regression. Также нужно уметь пользоваться программой SAS Enterprise Miner, основы использования которой можно изучить на курсах Applied Analytics Using SAS Enterprise Miner Part1 и Applied Analytics Using SAS Enterprise Miner  Part2

Аудитория

Аналитики, занимающиеся статистическим моделированием, аналитики данных, желающие использовать SAS Enterprise Miner для построения деревьев принятия решений.

Модели с древовидной структурой

  • Деревья классификации
  • Деревья регрессии

Рекурсивное разбиение

    • Бинарное разбиение и разбиение с несколькими наследниками.  
    • Критерии для разбиения
    • Пропущенные значения

    Обрезание дерева

    • Поправки для p-значения
    • Оптимизация прибыли/убытка
    • Деревья вероятности класса
    • Перекрёстная проверка (cross-validation)

    Дополнительные примеры использования деревьев принятия решений

    • Исследование данных
    • Сокращение размерности
    • Импутация

    Ансамбли деревьев принятия решений

    • Бэггинг / bagging
    • Arcing
    • Градиентный бустинг / gradient boosting