Продукты и решения SAS!
Отраслевые решения
Интегрированная система управления маркетингом
Единая аналитическая платформа
Продукты и технологии
Академическая программа
 

Base SAS

Обработка данных

Эффективная обработка данных

Base SAS предоставляет базовые возможности по организации доступа к данным, хранению данных (в формате SAS), управлению данными, анализу данных и созданию отчетов, т.е. выполнению различных задач на каждом из четырех основных этапов процесса преобразования "сырых" данных в полезную информацию.

Base SAS является центральным продуктом, обязательно присутствующим в любой конфигурации SAS System. Остальные продукты встраиваются в систему в виде  дополнительных элементов языка программирования SAS или интерактивных приложений.

Язык программирования SAS

Язык программирования, реализованный в продукте Base SAS, ориентирован на обработку данных. Это высокоуровневый процедурный язык программирования, нередко причисляемый к группе языков "четвертого поколения" (4GL). Программа на языке SAS представляет собой последовательность шагов обработки данных. Каждый из шагов обработки данных является либо "шагом данных" (data step), либо "шагом процедуры" (proc step). 

Enhanced Program EditorШаг данных является мощным средством обработки данных в рамках SAS System. Шаг данных – это неявный цикл по записям источника данных (существующего набора данных SAS, таблицы другой СУБД или внешнего файла) с возможностью осуществления произвольных операций на каждой итерации этого цикла. Возможности шага данных позволяют эффективно реализовать любой алгоритм обработки данных.

Шаг процедуры представляет собой вызов одной из процедур продукта Base SAS (или других продуктов SAS System). Каждая процедура реализует некоторый специализированный вид обработки данных или обеспечивает генерацию стандартных отчетов.

Программы SAS могут выполняться в различных режимах:

  • в диалоговом режиме (для интерактивной работы с данными, для исследования данных, для написания и отладки программ обработки данных),
  • в пакетном режиме (например, на регулярной основе для загрузки данных в хранилище данных или для генерации стандартных отчетов). 

Для работы с продуктом Base SAS необходимо знать используемый в нем язык программирования, поэтому сам по себе Base SAS нельзя назвать продуктом, предназначенным для конечных пользователей. Пользовательские приложения, выполняющие обработку данных средствами языка SAS, могут быть созданы с использованием продукта SAS/AF.

Рабочая среда системы

Рабочая среда является составной частью продукта Base SAS и позволяет работать с системой SAS в диалоговом режиме. Рабочая среда представляет собой многооконный графический пользовательский интерфейс с системой выпадающих и контекстных меню, панелями инструментов, командной строкой и другими стандартными элементами, обеспечивающими взаимодействие с пользователем. К основным окнам среды относятся:Explorer

  • Explorer – окно, напоминающее стандартное приложение Windows Explorer. Позволяет осуществлять навигацию по библиотекам и каталогам системы SAS, дает возможность копировать, переносить, удалять, создавать различные объекты и просматривать их свойства.
  • Program Editor – текстовый редактор, предназначенный для ввода текста программы. Окно Enhanced Program Editor обеспечивает цветовое выделение различных синтаксических конструкций языка SAS. 
  • Log – протокол работы программ SAS. В этом окне отображаются сообщения об ошибках в работе программы, различные предупреждения и уведомления. Сюда же пользователь может направить вывод значений требуемых переменных, например, для отладки работы кода.
  • Output – окно, в которое осуществляется вывод результатов работы программ, формирующих текстовые отчеты.
  • Graph Output – окно для вывода результатов работы процедур пакета SAS/GRAPH, формирующих графические отчеты.
  • Results Viewer – окно встроенного HTML браузера для просмотра отчетов, содержащих как текстовые , так и графические данные).
Доступ к данным

Продукт Base SAS позволяет считывать данные из текстовых или бинарных файлов. Возможности шага данных позволяют читать файлы любого формата (в частности, с разделителями, с фиксированной шириной полей, с записями комбинированной структуры, с записями, структура которых меняется от записи к записи, и т.д.). Любые файлы, формат которых известен и может быть формализован, могут быть преобразованы в наборы данных SAS.

Специальные продукты семейства SAS/ACCESS обеспечивают доступ к различным базам данных (ADABAS, DB2, Informix, Microsoft SQL Server, ODBC, Oracle, Sybase, Teradata и др.) и к файлам стандартных форматов (DBF, DIF, Excel и др.).

Управление данными

Окно просмотра содержимого набора данныхОкно рабочей среды Explorer обеспечивает возможность интерактивной работы с данными. Пользователь легко может просматривать структуру данных SAS, перемещать, копировать, удалять, переименовывать элементы библиотек, просматривать их свойства и их содержимое. 

Base SAS обладает мощными программными инструментами преобразования данных. С помощью шага данных можно легко и эффективно реализовать любой алгоритм обработки данных. Возможна работа с наборами данных SAS с помощью SQL запросов. Некоторые стандартные действия по обработке данных реализованы в виде специализированных процедур Base SAS. Среди таких стандартных действий можно выделить

  • сортировку наборов данных по одной или нескольким переменным,
  • агрегацию наборов данных по одной или нескольким классифицирующим переменным с подсчетом базовых статистик по анализируемым переменным,
  • транспонирование наборов данных,
  • ранжирование записей в наборе данных по значениям численных переменных,
  • сравнение наборов данных,
  • конкатенацию наборов данных,
  • копирование наборов данных и изменение атрибутов переменных и наборов данных.
Анализ данных

В Base SAS существует ряд статистических процедур, с помощью которых можно по численным переменным в наборах данных получить описательные статистики (сумма, количество, среднее, минимум, максимум, диапазон значений, стандартное отклонение, стандартная ошибка, дисперсия, эксцесс, коэффициент асимметрии – всего свыше 30 различных статистик), оценки доверительных интервалов, характеристики распределения случайных величин, провести тест на нормальность распределения и на равенство математических ожиданий, сформировать таблицу частотности, определить экстремумы, рассчитать корреляционную матрицу и т.д. 

Аналитические возможности Base SAS могут быть дополнены и расширены при помощи других продуктов, входящих в состав SAS System. SAS предоставляет средства для решения практически любых аналитических задач, в частности, для комплексного статистического анализа (SAS/STAT), интерактивного статистического анализа (SAS/Insight), анализа временных рядов и прогнозирования (SAS/ETS), контроля качества (SAS/QC), линейного и нелинейного программирования (SAS/OR), реализации матричных алгоритмов (SAS/IML), углубленного анализа данных (Enterprise Miner), оперативной аналитической обработки (SAS/EIS и SAS/MDDB Server) и т.д.

Представление данных

Результаты в виде HTML отчетаBase SAS содержит ряд процедур для генерации отчетов. Эти отчеты могут варьироваться от простого вывода таблицы на экран до достаточно сложных и нетиповых отчетов.

Процедуры генерации отчетов имеют выразительный синтаксис и позволяют достичь желаемого результата минимальными усилиями.

В продукт Base SAS включена подсистема унифицированного вывода результатов Output Delivery System (ODS). Механизм ODS позволяет отделить логику работы программы от дополнительных программных выражений, связанных с необходимостью сохранять результат в некотором формате. Программист пишет программу, выполняющую только содержательные действия, не заботясь о том, в каком именно формате будут представлены результаты работы этой программы. В зависимости от настроек ODS выполнение одной и той же программы может привести, например, как к созданию простого текстового отчета, так и к созданию отчета в формате HTML.

Система SAS поддерживает сохранение отчетов в следующих форматах: текст, HTML, XML, RTF, PDF, PostScript. Кроме того, возможно сохранение результатов процедур в виде наборов данных для последующей обработки.

Дополнительную информацию о продукте Base SAS Вы можете найти на Web-сервере SAS Institute по адресу: http://www.sas.com/technologies/bi/appdev/base/index.html или получить, обратившись в московский офис SAS Institute.

Вернуться к списку продуктов

Хотите узнать больше?

Платформа SAS® Enterprise Intelligence: Решение по бизнес-аналитике SAS® Business Intelligence


Материалы в формате PDF
Контактная информация
  (+7 495) 937-41-51
  (+7 495) 937-41-55
  info@rus.sas.com