Моделирование с помощью логистической регрессии
(PMLR)

Длительность: 2 дня.                Уровень: 4.             Версия ПО: 9.3

В этом курсе изучается построение предсказательных статистических моделей с помощью программного обеспечения SAS/STAT, и, в частности, процедуры LOGISTIC. Обсуждаются подходы для выбора переменных, оценки эффективности моделей, обработки пропущенных значений, использования эффективных методов для обработки больших наборов данных.
Слушатели этого курса научатся:

  • Использовать логистическую регрессию для моделирования бинарного отклика как функции известных переменных.
  • Создавать графики эффектов и отношений шансов используя возможности системы ODS
  • Как обращаться с пропущенными значениями переменных-предикторов
  • Как решать проблему мультиколлинеарности между переменными-предикторами
  • Оценивать эффективность модели и сравнивать модели.

Для прохождения этого курса вам нужно уметь писать и запускать программы SAS, создавать наборы данных SAS. Эти навыки вы можете получить на курсе Программирование на языке SAS. Часть 1: Основы . Также нужно знать основы статистического моделирования: как строить модели линейной и логистической регрессий с помощью программного обеспечения SAS. В курсе используются библиотеки SAS/GRAPH и SAS/STAT, основы работы с которыми можно изучить на курсе Statictics 1: Introduction to ANOVA, Regression and Logistic Regression.

Аудитория

Аналитики, занимающиеся статистическим моделированием, статистики, которым необходимо строить предсказательные модели, в особенности в банковской и финансовой сферах, прямом маркетинге, страховании и телекоммуникационной сфере.

 

Предсказательное моделирование

  • Бизнес-приложения
  • Проблемы при построении модели

Подгонка модели

  •     Оценка параметров
  •     Поправки на избыточный размер данных

 

Подготовка входных переменных

  •     Пропущенные значения
  •     Категориальные переменные
  •     Кластеризация переменных
  •     Отбор переменных
  •     Создание выборки

Эффективность классификатора

  •     ROC-график и  лифтовые диаграммы (Lift charts)
  •     Выбор оптимального порога отсечения
  •     Статистика Колмогорова-Смирнова (K-S)
  •     Статистика c
  •     Прибыль
  •     Вычисление нескольких моделей