Статистика 1: Введение в дисперсионный анализ, линейную и логистическую регрессию
(ST1)
Длительность: 3 дня. Уровень: 2. Версия ПО: 9.3
Данный курс предназначен для пользователей программного обеспечения SAS/STAT, выполняющих статистический анализ. В курсе обсуждаются t-тесты, дисперсионный анализ (ANOVA), линейная регрессия, а также краткое введение в построение логистической регрессии. Прохождение этого курса (или соответствующие практические знания) являются необходимым требованием для прохождения многих курсов по статистическому анализу. Более детальное обсуждение дисперсионного анализа и регрессии даётся в курсе Statistics 2: ANOVA and Regression. Более детальное обсуждение логистической регрессии даётся в курсах Categorical Data Analysis Using Logistic Regression course и Predictive Modeling Using Logistic Regression.
В данном курсе изучается
- Расчёт описательных статистик и исследование данных при помощи графических представлений
- Выполнение дисперсионного анализа и применение методов множественного сравнения
- Построение линейной регрессии и оценка соответствия допущениям
- Использование методов выбора регрессионной модели для помощи в выборе значимых переменных множественной регрессии
- Использование диагностических статистик для оценки соответствия допущениям и определения потенциальных выбросов во множественной регрессии
- Использование статистики хи-квадрат для выявления связей между дискретными переменными
- Подгонка логистической регрессии
Для успешного прохождения курса слушателям рекомендуется познакомиться с базовыми понятиями статистики (p-значение, тестирование гипотез, дисперсионный анализ, регрессия). Необходимым требованием является способность писать и запускать код на языке программирования SAS. Вы можете получить эти навыки на курсе Программирование на языке SAS. Часть 1: Основы.
Аудитория
Статистики, исследователи и бизнес-аналитики, которые используют программирование на языке SAS для анализа дискретных и непрерывных данных
Предварительные замечания
- Описательные статистики
- Статистика вывода
- Шаги для проведения статистических тестов гипотез
Введение в статистику
- Проверка распределения данных
- Получение и анализ выборки с помощью процедур UNIVARIATE и MEANS
- Графический анализ распределения данных в процедурах UNIVARIATE и SGPLOT
- Построение доверительных интервалов
- Выполнение простых проверок гипотез
Критерий Стьюдента (t-тест) и дисперсионный анализ
- Выполнение проверок разницы между средними двух групп с использованием PROC TTEST
- Выполнение однофакторного регрессионного анализа с помощью процедуры GLM
- Выполнение ретроспективных (post-hoc) тестов в процедуре PROC GLM
- Выполнение двухфакторного регрессионного анализа с взаимодействием и без него.
Линейная регрессия
- Вычисление корреляций с помощью процедуры CORR
- Построение простой линейной модели регрессии с помощью процедуры REG
- Понимание принципов множественной регрессии
- Использование методов автоматического выбора модели в процедуре PROC REG для выбора из нескольких потенциальных моделей
- Интерпретация моделей
Диагностика линейной регрессии
- Исследование ошибок
- Выявление выбросов
- Оценка коллинеарности
Анализ дискретных данных
- Создание частотных таблиц с помощью процедуры FREQ
- Проверка наличия категориальных ассоциаций с помощью процедуры FREQ
- Точные тесты
- Принципы логистической регрессии
- Построение логистической регрессии с одним или несколькими предикторами