Моделирование с помощью деревьев принятия решений
(DMDT71)
Длительность: 2 дня. Уровень: 4. Версия ПО: 9.3
В этом курсе изучается построение древовидных предсказательных статистических моделей и методология для построения деревьев решений, регулирования их глубины и оценки их качества. Дополнительно в курсе обсуждаются различные варианты использования деревьев – исследовательский анализ данных, сокращение размерности, импутация пропущенных значений.
Слушатели этого курса научатся:
- Строить древовидные модели, в том числе деревья классификации и деревья регрессии
- Использовать методологию для построения деревьев принятия решений, регулирования их глубины и оценки их качества
- Использовать деревья принятия решений для исследования данных, сокращения размерности моделей и импутации пропущенных значений
Для прохождения этого курса вам нужно знать основные статистические понятия. Эти навыки вы можете получить на курсе Statictics 1: Introduction to ANOVA, Regression and Logistic Regression. Также нужно уметь пользоваться программой SAS Enterprise Miner, основы использования которой можно изучить на курсах Applied Analytics Using SAS Enterprise Miner Part1 и Applied Analytics Using SAS Enterprise Miner Part2
Аудитория
Аналитики, занимающиеся статистическим моделированием, аналитики данных, желающие использовать SAS Enterprise Miner для построения деревьев принятия решений.
Модели с древовидной структурой
- Деревья классификации
- Деревья регрессии
Рекурсивное разбиение
- Бинарное разбиение и разбиение с несколькими наследниками.
- Критерии для разбиения
- Пропущенные значения
Обрезание дерева
- Поправки для p-значения
- Оптимизация прибыли/убытка
- Деревья вероятности класса
- Перекрёстная проверка (cross-validation)
Дополнительные примеры использования деревьев принятия решений
- Исследование данных
- Сокращение размерности
- Импутация
Ансамбли деревьев принятия решений
- Бэггинг / bagging
- Arcing
- Градиентный бустинг / gradient boosting