Статистика 1: Введение в дисперсионный анализ, линейную и логистическую регрессию
(ST1)

Длительность: 3 дня.                Уровень: 2.              Версия ПО: 9.3

Данный курс предназначен для пользователей программного обеспечения SAS/STAT, выполняющих статистический анализ.  В курсе обсуждаются t-тесты, дисперсионный анализ (ANOVA), линейная регрессия, а также краткое введение в построение логистической регрессии. Прохождение этого курса (или соответствующие практические знания) являются необходимым требованием для прохождения многих курсов по статистическому анализу. Более детальное обсуждение дисперсионного анализа и регрессии даётся в курсе Statistics 2: ANOVA and Regression. Более детальное обсуждение логистической регрессии даётся в курсах Categorical Data Analysis Using Logistic Regression course и Predictive Modeling Using Logistic Regression.

В данном курсе изучается

  • Расчёт описательных статистик и исследование данных при помощи графических представлений
  • Выполнение дисперсионного анализа и применение методов множественного сравнения
  • Построение линейной регрессии и оценка соответствия допущениям
  • Использование методов выбора регрессионной модели для помощи в выборе значимых переменных множественной регрессии
  • Использование диагностических статистик для оценки соответствия допущениям и определения потенциальных выбросов во множественной регрессии
  • Использование статистики хи-квадрат для выявления связей между дискретными переменными
  • Подгонка логистической регрессии

Для успешного прохождения курса слушателям рекомендуется познакомиться с базовыми понятиями статистики (p-значение, тестирование гипотез, дисперсионный анализ, регрессия). Необходимым требованием является способность писать и запускать код на языке программирования SAS. Вы можете получить эти навыки на курсе Программирование на языке SAS. Часть 1: Основы.

Аудитория

Статистики, исследователи и бизнес-аналитики, которые используют программирование на языке SAS для анализа дискретных и непрерывных данных

Предварительные замечания

  • Описательные статистики
  • Статистика вывода
  • Шаги для проведения статистических тестов гипотез

Введение в статистику

  • Проверка распределения данных
  • Получение и анализ выборки с помощью процедур UNIVARIATE и MEANS
  • Графический анализ распределения данных в процедурах UNIVARIATE и SGPLOT
  • Построение доверительных интервалов
  • Выполнение простых проверок гипотез

Критерий Стьюдента (t-тест) и дисперсионный анализ

  • Выполнение проверок разницы между средними двух групп с использованием PROC TTEST
  • Выполнение однофакторного регрессионного анализа с помощью процедуры GLM
  • Выполнение ретроспективных (post-hoc) тестов в процедуре PROC GLM
  • Выполнение двухфакторного регрессионного анализа с взаимодействием и без него.

Линейная регрессия

  • Вычисление корреляций с помощью процедуры CORR
  • Построение простой линейной модели регрессии с помощью процедуры REG
  • Понимание принципов множественной регрессии
  • Использование методов автоматического выбора модели в процедуре PROC REG для выбора из нескольких потенциальных моделей
  • Интерпретация моделей

Диагностика линейной регрессии

  • Исследование ошибок
  • Выявление выбросов
  • Оценка коллинеарности

Анализ дискретных данных

  • Создание частотных таблиц с помощью процедуры FREQ
  • Проверка наличия категориальных ассоциаций с помощью процедуры FREQ
  • Точные тесты
  • Принципы логистической регрессии
  • Построение логистической регрессии с одним или несколькими предикторами