Статистика 2: Дисперсионный и регрессионный анализ
(ST2)
Длительность: 3 дня. Уровень: 3. Версия ПО: 9.3
Данный курс обучает анализу данных с непрерывным и дискретным откликом. В курсе обсуждаются линейная регрессия, регрессия Пуассона, отрицательная биномиальная регрессия, гамма регрессия, дисперсионный анализ, линейная регрессия с переменными-индикаторами, ковариационный анализ и смешанные модели дисперсионного анализа.
В курсе изучается
- Использование графических возможностей системы ODS и новых графических процедур SAS 9.3
- Подгонка моделей полиномиальной регрессии с помощью процедуры REG
- Выбор моделей на основании нескольких статистик и методы автоматический выбор моделей с использованием процедуры REG
- Оценка модели и предположений для её построения с использованием процедур REG, GLM, GENMOD и UNIVARIATE
- Подгонка моделей регрессии Пуассона, отрицательной биномиальной и гамма регрессии с помощью процедуры GENMOD
- Выполнение дисперсионного анализа с помощью процедуры GLM
- Операторы CONTRAST и ESTIMATE в PROC GLM
- Подгонка регрессионных моделей с переменными-индикаторами с использованием PROC REG и модели ковариационного анализа с помощью PROC GLM
- Подгонка моделей со случайными эффектами с применением процедуры MIXED
- Создание разнообразных статистических диаграмм.
Слушатели должны пройти курсы Программирование на языке SAS. Часть 1: Основы и Statictics 1: Introduction to ANOVA, Regression and Logistic Regression или иметь эквивалентный этим курсам опыт. В частности необходимо знать:
- Как создавать и изменять наборы данных SAS
- Как строить простую и множественную линейную регрессию с помощью процедуры GLM
- Как проводить однофакторный дисперсионный анализ с помощью процедуры GLM
- Базовые статистические понятия – нормальное распределение, выборочные распределения, тестирование гипотез
Аудитория
Аналитики данных и исследователи с начальной подготовкой по статистике.
Регрессия
- Построение и оценка моделей множественной полиномиальной регрессии
- Нарушения предположений для построения модели
Дисперсионный анализ
- Выполнение многофакторного дисперсионного анализа
- Выявление значимых взаимодействий в модели
- Операторы CONTRAST и ESTIMATE
- Проблемы, связанные с несбалансираванными данными
Регрессия с использованием переменных-индикаторов и ковариационный анализ.
- Применение и интерпретация переменных-индикаторов в процедуре REG
- Построение и интерпретация моделей ковариационного анализа, с применением процедуры GLM
- Сравнение регрессии с применением переменных-индикаторов с ковариационным анализом
Обобщённые линейные модели
- Применение процедуры GENMOD для подгонки моделей регрессии Пуассона, отрицательной биномиальной и гамма регрессии
Смешанная линейная модель
- Анализ смешанной линейной модели