Программирование на языке SAS,
Часть 3: Продвинутые методы и оптимизация использования ресурсов
(PRG3)

Длительность: 3 дня.            Уровень: 4.            Версия ПО: 9.3

Данный курс предназначен для опытных программистов SAS, которые подготавливают данные для последующего анализа. В курсе рассматриваются и сравниваются различные приёмы работы с данными, которые позволят программистам выбирать наиболее подходящее решение с учетом доступных вычислительных ресурсов.

В этом курсе рассматриваются следующие темы:

  • Управление использованием разных вычислительных ресурсов: память, операции ввода-вывода, центральный процессор.
  • Использование бенчмарков для оценки производительности программ
  • Создание и использование индексов
  • Вертикальное и горизонтальное объединение данных
  • Использование  на шаге данных хэш-объектов и итераторов, массивов и форматов в качестве методов табличного поиска.
  • Сжатие наборов данных SAS
  • Создание выборки из набора данных SAS
  • Создание представлений
  • Сокращение размера наборов данных за счёт уменьшения размеров числовых переменных
  • Создание и использование пользовательских функций и подпрограмм

Сертификация

Данный курс помогает подготовиться к сертификационному экзамену SAS Advanced Programming Exam for SAS 9.

Этот курс не подходит для специалистов начинающего уровня. Для успешного восприятия материалов курса слушателям необходимо иметь практический опыт в программировании для SAS, а также рекомендуется посещение курса «Программирование на языке SAS. Часть 2: Методы обработки данных». В частности посетителям курса необходимо:

  • Понимать структуру файлов в операционной системе и уметь выполнять в ней основные задачи;
  • Знать основные понятия программирования;
  • Понимать фазы компиляции и выполнения на шаге DATA;
  • Использовать различные методы создания наборов данных SAS из внешних файлов;
  • Использовать ПО SAS для доступа к библиотекам данных SAS;
  • Создавать и использовать значения даты, хранимой в формате SAS;
  • Считывать, объединять наборы данных SAS с помощью различных методов;
  • Использовать параметры наборов данных DROP=, KEEP= и RENAME=;
  • Создавать несколько выходных наборов данных;
  • Использовать массивы и цикл DO для итеративной обработки данных,
  • Использовать функции SAS для обработки и преобразования данных
  • Применять процедуру FORMAT для создания пользовательских форматов

Аудитория

Для прохождения данного курса слушатели должны иметь опыт программирования на языке SAS.

Введение

  • Структура курса
  • Измерение производительности
  • Обработка на шаге DATA

Контроль операций ввода-вывода и использования памяти

  • Контроль операций ввода-вывода
  • Контроль размера набора данных
  • Сжатие набора данных SAS
  • Контроль использования памяти (самостоятельное изучение)
  • Контроль размера страницы и количества доступных буферов (самостоятельное изучение)

Доступ к наблюдениям

  • Создание индекса
  • Использование индекса
  • Создание выборки данных, оптимизация с использованием индексов (самостоятельное изучение)

Введение в методики табличного поиска

  • Методы, использующие размещение таблицы для поиска в памяти
  • Методы, использующие размещение таблицы для поиска на диске

Использование массивов на шаге данных

  • Использование одномерных массивов
  • Использование многомерных массивов
  • Загрузка многомерного массива из набора данных SAS

Использование хэш-объекта и хэш-итератора на шаге данных

  • Введение
  • Использование методов хэш-объекта
  • Загрузка хэш-объекта из набора данных SAS
  • Использование хэш-итератора на шаге данных
  • Использование хэш-объекта для поиска в данных, организованных последовательно (самостоятельное изучение)

Создание и использование форматов

  • Использование форматов в качестве метода табличного поиска
  • Использование форматов для отображения данных (самостоятельное изучение)

Горизонтальное объединение данных

  • Объединение данных на шаге DATA и с использование процедуры SQL
  • Использование индексов для объединения данных
  • Объединение сведённых и детализированных данных
  • Объединение данных по условию

Сортировка наборов данных SAS

  • Использование процедуры SORT
  • Использование оператора BY для обработки данных (самостоятельное изучение)

Методики для повышения эффективности при написании программ

  • Введение
  • Написание гибкого программного кода
  • Создание представлений (SAS view)
  • Использование операторов FILE и PUT для создания файла с программой SAS
  • Использование процедуры FCMP (самостоятельное изучение)

Настройка сессии SAS (самостоятельное изучение)

  • Введение
  • Редактирование конфигурационного файла
  • Создание файла autoexec.sas
  • Использование регистра SAS