Моделирование с помощью логистической регрессии
(PMLR)
Длительность: 2 дня. Уровень: 4. Версия ПО: 9.3
В этом курсе изучается построение предсказательных статистических моделей с помощью программного обеспечения SAS/STAT, и, в частности, процедуры LOGISTIC. Обсуждаются подходы для выбора переменных, оценки эффективности моделей, обработки пропущенных значений, использования эффективных методов для обработки больших наборов данных.
Слушатели этого курса научатся:
- Использовать логистическую регрессию для моделирования бинарного отклика как функции известных переменных.
- Создавать графики эффектов и отношений шансов используя возможности системы ODS
- Как обращаться с пропущенными значениями переменных-предикторов
- Как решать проблему мультиколлинеарности между переменными-предикторами
- Оценивать эффективность модели и сравнивать модели.
Для прохождения этого курса вам нужно уметь писать и запускать программы SAS, создавать наборы данных SAS. Эти навыки вы можете получить на курсе Программирование на языке SAS. Часть 1: Основы . Также нужно знать основы статистического моделирования: как строить модели линейной и логистической регрессий с помощью программного обеспечения SAS. В курсе используются библиотеки SAS/GRAPH и SAS/STAT, основы работы с которыми можно изучить на курсе Statictics 1: Introduction to ANOVA, Regression and Logistic Regression.
Аудитория
Аналитики, занимающиеся статистическим моделированием, статистики, которым необходимо строить предсказательные модели, в особенности в банковской и финансовой сферах, прямом маркетинге, страховании и телекоммуникационной сфере.
Предсказательное моделирование
- Бизнес-приложения
- Проблемы при построении модели
Подгонка модели
- Оценка параметров
- Поправки на избыточный размер данных
Подготовка входных переменных
- Пропущенные значения
- Категориальные переменные
- Кластеризация переменных
- Отбор переменных
- Создание выборки
Эффективность классификатора
- ROC-график и лифтовые диаграммы (Lift charts)
- Выбор оптимального порога отсечения
- Статистика Колмогорова-Смирнова (K-S)
- Статистика c
- Прибыль
- Вычисление нескольких моделей