SAS ®Academy for Data Science

Big Data Certification

Станьте сертифицированным специалистом SAS® в области Big Data

Используйте инструменты и технологии, предназначенные для обработки больших данных. SAS Certified Big Data Professional предоставляет необходимые знания и навыки.

Abstract Green Art

SAS ® Big Data Certification

Courses

10 Курсов

Содержание курсов предназначено для подготовки к сертификационным экзаменам

+

Case Study Icon

Практические примеры

Примеры из мировой практики, закрепляющие изученный материал

+

Exam

2 Экзамена

Сдайте оба экзамена для получения статуса сертифицированного специалиста

Рассматриваемые темы

  • Навыки программирования SAS
  • Доступ к данным, их трансформация и управление данными
  • Улучшение качества данных для отчетов и аналитики
  • Основные навыки коммуникации
  • Основы статистики и аналитики
  • Работа с Hadoop, Hive, Pig и SAS
  • Исследование и визуализация данных

SAS software covered

  • Base SAS ®
  • SAS ® Enterprice Guide ®
  • SAS®Enterprise Miner™4
  • SAS®In-Memory Statistics
  • SAS®Studio
  • SAS / STAT®
  • SAS®Visual Analytics
  • DataFlux ® Data Management Server
  • DataFlux ® Data Management Studio

Самостоятельное изучение в формате e-Learning

Самостоятельное изучение

  • Доступ к обучению в формате e-Learning (24/7 online доступ).
  • Изучайте курс в удобном Вам темпе в течение 12 месяцев.
  • Примеры из мировой практики, закрепляющие изученный материал.
  • Доступ к программному обеспечению SAS для решения практических упражнений.
  • Доступ к сообществу SAS для помощи в обучении.

Предварительные требования

Требуется опыт программирования в SAS или в любом другом языке не менее 6 месяцев. Курс SAS Programming for Data Science Fast Track 1 поможет Вам освоить программирование SAS.

Что Вы узнаете

Программирование на языке SAS, SQL и Макро язык

SAS Fundamentals: Programming, SQL and Macro Language (classroom only)

Этот курс посвящен методам обработки данных, использующим шаг DATA и процедуру SQL для доступа, преобразования, объединения и агрегации наборов данных SAS. Вы узнаете, как использовать компоненты макросов SAS для создания текстовых замещений в коде SAS и для написания простых макропрограмм.

Изучаемые темы

  • Группировка и агрегация данных.
  • Создание запросов и срезов данных.
  • Преобразование различных типов переменных.
  • Объединение наборов данных, используя join и merge.
  • Обработка данных в цикле DO и обработка массивов SAS.
  • Реструктуризация набора данных SAS.
  • Замена запрограммированных значений в коде SAS.
  • Использование макропеременных.
  • Создание простых макроопределений.

Модуль 1: Подготовка Big Data, статистика и визуальное исследование

Course 1: Big Data Challenges and Analysis-Driven Data

Этот курс рассматривает проблемы, связанные с Big Data и данными, полученными в результате анализа.

Изучаемые темы

  • Чтение внешних файлов.
  • Хранение и обработка данных.
  • Объединение Hadoop и SAS.
  • Определение проблем, связанных с Big Data и их решение.

Course 2: Exploring Data With SAS Visual Analytics

В этом курсе Вы узнаете, как использовать SAS Visual Analitics Explorer для исследования таблиц в памяти, загруженных SAS® LASR™ Analytic Server и выполнять расширенный анализ данных.

Изучаемые темы

  • Нахождение прежде неизвестных связей и выделение тенденций Ваших данных.
  • Визуализация данных с помощью диаграмм, графиков и таблиц.
  • Использование автоматических диаграмм для визуализации данных наилучшим образом.
  • Использование продвинутых графических элементов, таких как сетевая диаграмма, диаграмма Sankey и облако слов.
  • Добавление аналитики к графикам, включая описание ее результатов.
  • Навигация по Вашим данным, используя иерархии, созданные "на лету".

Course 3: Statistics 1: Introduction to ANOVA, Regression and Logistic Regression

Этот вводный курс SAS/STAT ® фокусируется на t-тестах, ANOVA и линейной регрессии, и включает краткое введение в понятие логистической регрессии.

Изучаемые темы

  • Создание описательной статистики и изучение данных с помощью графиков.
  • Выполнение дисперсионного анализа и применение нескольких методов сравнения.
  • Выполнение линейной регрессии и оценка допущений.
  • Использование методов выбора регрессионной модели для определения переменной прогноза при множественной регрессии.
  • Использование статистического прогнозированиям для доступа к статистическим допущениям и идентификации потенциальных выбросов в множественной регрессии.
  • Использование статистики хи-квадрат для обнаружения ассоциаций между категориальными переменными.
  • Установка модели множественной логистической регрессии.
  • Подсчет новых данных с использованием разработанных моделей.

Course 4: Preparing Data for Analysis and Reporting

В данном курсе Вы научитесь выполнять задачи управления данными, такие как улучшение их качества, разрешение сущностей и мониторинг данных.

Рассматриваемые темы

  • Создание, просмотр и анализ исследований данных.
  • Создание и просмотр профилей данных.
  • Создание задач для улучшения данных
  • Создание аспектов мониторинга для Ваших данных.
  • Понимание компонентов QKB.
  • Использование редактора компонентов.
  • Понимание выражений различных типов.
  • Создание нового типа данных (опционально).

Course 5: Crafting Compelling (and true) Data Stories

Умение легко и просто объяснить итоги своей аналитической работы - ключевой навык при общении с руководством организации. Результаты анализа данных могут существенно изменить работу компании. Основная задача - доказать ценность и применимость итогов своей работы. В этом курсе Вы узнаете, почему такие умения Вам необходимо развивать. Когда аргументы работают, а когда нет.

Модуль 1 готовит Вас к сертификационному экзамену SAS Big Data Preparation, Statistics and Visual Exploration.


Модуль 2 Программирование и загрузка Big Data

Course 1: Introduction to SAS and Hadoop: Essentials

В этом курсе Вы узнаете, как использовать методы программирования SAS для чтения, записи и управления данными Hadoop. Вы узнаете, как использовать методы Base SAS для чтения и записи необработанных данных с помощью шага DATA, управления распределенной файловой системой Hadoop (HDFS) и выполнения MapReduce и кода Pig из SAS с помощью процедуры HADOOP. Вы также узнаете, как использовать методы SAS/ACCESS ® Interface to Hadoop, которые позволяют LIBNAME и методам сквозной передачи SQL читать и писать структуры таблиц Hive или Impala.

Изучаемые темы

  • Доступ к дистрибутивам Hadoop с использованием оператора LIBNAME и средства передачи данных SQL.
  • Создание и использование сквозных запросов SQL.
  • Использование опций и методов повышения эффективности для оптимизации доступа к данным.
  • Объединение таблиц с помощью процедуры SQL и шага DATA.
  • Чтение и запись файлов Hadoop с помощью оператора FILENAME.
  • Выполнение и использование команд Hadoop с PROC HADOOP.
  • Использование процедур Base SAS с Hadoop.

Course 2: DS2 Programming Essentials With Hadoop

Этот курс сосредоточен вокруг DS2, языке 4го поколения собственной разработки SAS с продвинутыми возможности по обработке данных, дающему возможность параллельной обработки данных и хранения больших массивов данных с повторно используемыми методами и пакетами.

Изучаемые темы

  • Определение совпадений и различий между шагом SAS DATA и шагом DS2 DATA.
  • Преобразование шага SAS DATA в DS2.
  • Создание деклараций переменных DS2, выражений и методов для преобразования данных, обработки и условной обработки.
  • Создание пользовательских и заранее заданных пакетов для хранения, обмена и выполнения методов DS2.
  • Создание и выполнение потоков DS2 для параллельной обработки.
  • Использование SAS In-Database Code Accelerator для запуска кода DS2 вне сеанса SAS.
  • Выполнение кода DS2 в модуляторе SAS High-Performance Analytics с использованием процедуры HPDS2.

Course 3: Hadoop Data Management With Hive, Pig and SAS

В этом курсе Вы будете использовать методы обработки данных для подготовки структурированных и неструктурированных больших данных для анализа. Вы научитесь компоновать данные в структурированные таблицы используя Apache Hive и Apache Pig. Вы также научитесь технологиям и методам ПО SAS, интегрированных с Hive и Pig, так же как и научитесь использовать эти открытые исходные возможности, программируя на SAS Base с интерфейсом SAS/ACCESS для Hadoop, а также с SAS Data Integration Studio.

Рассматриваемые темы

  • Перемещение данных в экосистему Hadoop.
  • Использование Hive для создания хранилища данных в Hadoop, выполнение анализа данных с помощью языка запросов Hive (HiveQL) и соединение источников данных.
  • Выполнение извлечения, преобразования и загрузки (ETL).
  • Организация данных в Hadoop по использованию.
  • Анализ неструктурированных данных с использованием Pig.
  • Соединение больших наборов данных используя Pig.
  • Использование пользовательских функций (UDFs).
  • Анализ Big Data в Hadoop с использованием Hive and Pig.
  • Использование программирования SAS для отправки программ Hive и Pig, которые выполняются в Hadoop, и сохранение результатов в Hadoop или возврат результатов в SAS.
  • Использование программирования SAS для перемещения данных между сервером SAS и HDFS.
  • Построение задач SAS Data Integration Studio, которые интегрируются с процессами Hive и Pig и HDFS.

Course 4: Getting Started With SAS In-Memory Statistics

В этом курсе основное внимание уделяется доступу к данным на SAS LASR Analytic Server и выполнению исследовательского анализа данных и их подготовке. Темы включают запуск сервера, загрузку данных и обработку данных на SAS LASR Analytic Server с использованием процедуры IMSTAT. Темы IMSTAT включают: получение новых временных и постоянных таблиц и колонок, расчёт сводных статистик (таких как: математическое ожидание, частота и процентиль) и создание фильтров и соединений по данным в памяти.

Изучаемые темы

  • Запуск SAS LASR Analytic Server.
  • Загрузка таблиц в память на SAS LASR Analytic Server.
  • Обработка in-memory таблиц c помощью PROC LASR и PROC IMSTAT.
  • Эффективный доступ к данным через интеллектуальное разделение
  • Получение новых временных и постоянных таблиц и переменных.
  • Создание фильтров и объединений на данных в памяти.
  • Экспорт результирующих таблиц ODS для клиентской графической разработки.
  • Создание описательной статистики, включая количество, процентили и среднее.
  • Создание сводных отчетов с более чем тремя измерениями, с кросс табуляцией и с случайным заполнением.
  • Получение оценок плотности ядра с использованием нормальных функций.

Модуль 2 готовит Вас к сертификационному экзамену SAS Big Data Programming and Loading

Background PBLS 2014 Speakers

Регистрируйтесь!

Самостоятельное обучение
в формате e-learning

check icon white

10 ключевых курсов.

check icon white

100 часов доступа к ПО SAS для практических занятий.

$2,250/12 месяцев

Скидка 50% на сертификационные экзамены по программе.

The training has been very valuable for me to get a broad understanding and knowledge about the different tools and ways to extract value from data

Frank Mortagne
Выпускник SAS Academy for Data Science

Начните обучение сейчас

Мы готовы ответить на все интересующие Вас вопросы.

Свяжитесь с нами любым удобным способом – по телефону или по электронной почте. 

Man and woman looking at a tablet

По интересующим вопросам обращайтесь!

Here are some of our most frequently asked questions.


Подходит ли мне эта программа?

Эта программа идеально подходит для тех, кто хочет, основываясь на базовых знаниях в области программирования изучить, как собирать и анализировать Big Data в SAS.

Какие экзамены необходимо сдать для получения статуса сертифицированного специалиста?

Пройдите оба сертификационных экзамена, чтобы получить сертификат SAS Certified Big Data Professional. Сертификационные экзамены необходимо приобретать отдельно.

Обладаете требуемыми знаниями для сдачи экзамена? Вы можете сдать экзамен, не заканчивая обучение. Свяжитесь с нами для получения более детальной информации по возможности сдачи экзамена.

Что входит в формат самостоятельного обучения?

  • SAS Certified Big Data Professional: 150 часов e-Learning + 100 часов виртуальной лаборатории
  • Big Data Preparation, Statistics and Visual Exploration: 76 часов e-Learning + 50 часов виртуальной лаборатории
  • Big Data Programming and Loading: 74 часа обучения в формате e-Learning + 50 часов виртуальной лаборатории

Сертификационные экзамены необходимо приобретать отдельно от версии обучения Self-Paced.

Длительность лицензии: 180 дней

Как получить доступ к ПО SAS?

Доступ к ПО SAS включен в оба формата обучения. Вы можете при необходимости приобрести дополнительное лабораторное время с шагом в 15 часов.

  • Подготовка больших данных, статистика и визуальное исследование - $75
  • Программирование Big Data и загрузка - $175

Доступны ли практические экзамены?

Да! Студенты, проходящие самостоятельное обучение (формат e-learning) могут приобрести практические экзамены Практические экзамены включены в стоимость очного формата обучения.

Сколько времени потребуется для завершения программы?

Если Вы посвятите обучению 8-10 часов в неделю, Вы можете завершить программу через 6 месяцев.

Что необходимо для самостоятельного обучения?

Посмотрите для получения дополнительной информации e-Learning system requirements


Grow with SAS!

catalog icon

Международный каталог

Куры и сертификационные экзамены за 2017 год

webinar icon

Вебинары с экспертами

Уникальная возможность задать любые вопросы международным экспертам SAS.

newsletter icon

Подписаться на новостную рассылку

Будьте в курсе обучения, сертификации и книжных новинок SAS .

Back to Top