Программирование на языке SAS,
Часть 3: Продвинутые методы и оптимизация использования ресурсов
(PRG3)
Длительность: 3 дня. Уровень: 4. Версия ПО: 9.3
Данный курс предназначен для опытных программистов SAS, которые подготавливают данные для последующего анализа. В курсе рассматриваются и сравниваются различные приёмы работы с данными, которые позволят программистам выбирать наиболее подходящее решение с учетом доступных вычислительных ресурсов.
В этом курсе рассматриваются следующие темы:
- Управление использованием разных вычислительных ресурсов: память, операции ввода-вывода, центральный процессор.
- Использование бенчмарков для оценки производительности программ
- Создание и использование индексов
- Вертикальное и горизонтальное объединение данных
- Использование на шаге данных хэш-объектов и итераторов, массивов и форматов в качестве методов табличного поиска.
- Сжатие наборов данных SAS
- Создание выборки из набора данных SAS
- Создание представлений
- Сокращение размера наборов данных за счёт уменьшения размеров числовых переменных
- Создание и использование пользовательских функций и подпрограмм
Сертификация
Данный курс помогает подготовиться к сертификационному экзамену SAS Advanced Programming Exam for SAS 9.
Этот курс не подходит для специалистов начинающего уровня. Для успешного восприятия материалов курса слушателям необходимо иметь практический опыт в программировании для SAS, а также рекомендуется посещение курса «Программирование на языке SAS. Часть 2: Методы обработки данных». В частности посетителям курса необходимо:
- Понимать структуру файлов в операционной системе и уметь выполнять в ней основные задачи;
- Знать основные понятия программирования;
- Понимать фазы компиляции и выполнения на шаге DATA;
- Использовать различные методы создания наборов данных SAS из внешних файлов;
- Использовать ПО SAS для доступа к библиотекам данных SAS;
- Создавать и использовать значения даты, хранимой в формате SAS;
- Считывать, объединять наборы данных SAS с помощью различных методов;
- Использовать параметры наборов данных DROP=, KEEP= и RENAME=;
- Создавать несколько выходных наборов данных;
- Использовать массивы и цикл DO для итеративной обработки данных,
- Использовать функции SAS для обработки и преобразования данных
- Применять процедуру FORMAT для создания пользовательских форматов
Аудитория
Для прохождения данного курса слушатели должны иметь опыт программирования на языке SAS.
Введение
- Структура курса
- Измерение производительности
- Обработка на шаге DATA
Контроль операций ввода-вывода и использования памяти
- Контроль операций ввода-вывода
- Контроль размера набора данных
- Сжатие набора данных SAS
- Контроль использования памяти (самостоятельное изучение)
- Контроль размера страницы и количества доступных буферов (самостоятельное изучение)
Доступ к наблюдениям
- Создание индекса
- Использование индекса
- Создание выборки данных, оптимизация с использованием индексов (самостоятельное изучение)
Введение в методики табличного поиска
- Методы, использующие размещение таблицы для поиска в памяти
- Методы, использующие размещение таблицы для поиска на диске
Использование массивов на шаге данных
- Использование одномерных массивов
- Использование многомерных массивов
- Загрузка многомерного массива из набора данных SAS
Использование хэш-объекта и хэш-итератора на шаге данных
- Введение
- Использование методов хэш-объекта
- Загрузка хэш-объекта из набора данных SAS
- Использование хэш-итератора на шаге данных
- Использование хэш-объекта для поиска в данных, организованных последовательно (самостоятельное изучение)
Создание и использование форматов
- Использование форматов в качестве метода табличного поиска
- Использование форматов для отображения данных (самостоятельное изучение)
Горизонтальное объединение данных
- Объединение данных на шаге DATA и с использование процедуры SQL
- Использование индексов для объединения данных
- Объединение сведённых и детализированных данных
- Объединение данных по условию
Сортировка наборов данных SAS
- Использование процедуры SORT
- Использование оператора BY для обработки данных (самостоятельное изучение)
Методики для повышения эффективности при написании программ
- Введение
- Написание гибкого программного кода
- Создание представлений (SAS view)
- Использование операторов FILE и PUT для создания файла с программой SAS
- Использование процедуры FCMP (самостоятельное изучение)
Настройка сессии SAS (самостоятельное изучение)
- Введение
- Редактирование конфигурационного файла
- Создание файла autoexec.sas
- Использование регистра SAS