SAS® Unified Insights MM Features

Market-leading data mining & machine learning

  • Provides GUI-based data mining and machine learning via a single, collaborative and highly scalable environment.
  • Provides open source integration with R, Python, Java and Lua models.
  • Lets you use model competition to identify and deploy the most effective model.

View more market-leading data mining & machine learning features

Интерактивное программирование в среде веб-разработки

  • Визуальный интерфейс для всего аналитического жизненного цикла.
  • Перетаскивание интерактивного интерфейса не требует кодирования, хотя кодирование является опцией.
  • Поддерживает автоматическое создание кода на каждом узле в конвейере.
  • Выберите шаблоны лучших практик (базовый, средний или расширенный), чтобы быстро приступить к выполнению задач машинного обучения или воспользуйтесь нашим процессом автоматического моделирования.
  • Отчеты по интерпретируемости, такие как PD, LIME, ICE и Kernel SHAP.
  • Изучайте данные из Model Studio и запускайте непосредственно в SAS Visual Analytics.
  • Редактировать модели, импортированные из SAS Visual Analytics в Model Studio.
  • Просмотр данных в каждом узле в Model Studio.
  • Запустите пакетный код SAS ® Enterprise Miner 14.3 в Model Studio.
  • Предоставляет среду для совместной работы, позволяющую легко обмениваться данными, фрагментами кода, аннотациями и лучшими практиками среди разных персон.
  • Создавайте, управляйте и делитесь контентом, а также управляйте разрешениями на контент через SAS Drive.
  • Программа просмотра линии SAS визуально отображает взаимосвязи между решениями, моделями и данными.

Интеллектуальная автоматизация

  • Общедоступный API-интерфейс для автоматизации многих сложных этапов моделирования для построения моделей машинного обучения - от обработки данных до разработки функций, выбора алгоритмов и развертывания.
  • Узел Automatic Feature Engineering для автоматической очистки, преобразования и выбора функций для моделей.
  • Узел автоматического моделирования для автоматического выбора наилучшей модели с использованием набора процедур оптимизации и автонастройки по нескольким методикам.

Поколение естественного языка

  • Просматривать результаты на простом языке для облегчения понимания докладов, включая оценку моделей и интерпретируемость.

Встроенная поддержка языков Python и R

  • Встраивайте открытый исходный код в анализ и вызывайте алгоритмы с открытым исходным кодом в Model Studio.
  • Узел Open Source Code в Model Studio не зависит от версий Python или R.

Глубокое обучение с Python (DLPy)

  • Создавайте модели глубокого обучения для изображений, текста, аудио и данных временных рядов, используя Jupyter Notebook.
  • API высокого уровня доступны на GitHub для:
    • Глубокие нейронные сети для табличных данных.
    • Классификация изображений и регрессия.
    • Обнаружение объекта.
    • Задачи на основе RNN - классификация текста, генерация текста и маркировка последовательности.
    • Обработка и моделирование временных рядов на основе RNN.
  • Поддержка предопределенных сетевых архитектур, таких как LeNet, VGG, ResNet, DenseNet, Darknet, Inception, ShuffleNet, MobileNet, YOLO, Tiny YOLO, Faster R-CNN и U-Net.
  • Импорт и экспорт моделей глубокого обучения в формате ONNX.

Процедуры SAS ® (PROC) и действия CAS

  • Программный интерфейс (SAS Studio) позволяет ИТ-специалистам или разработчикам получать доступ к серверу CAS, загружать и сохранять данные непосредственно с сервера CAS, а также поддерживать локальную и удаленную обработку на сервере CAS.
  • Программисты Python, Java, R, Lua и Scala или ИТ-специалисты могут получать доступ к данным и выполнять основные операции с данными на сервере CAS или выполнять действия CAS с помощью PROC CAS.
  • Поддержка действий CAS для интерпретируемости, разработки функций и моделирования.
  • Интегрируйте и добавьте возможности SAS в другие приложения с помощью API REST.

Масштабируемая, распределенная аналитическая обработка в памяти

  • Распределенная обработка в памяти сложных аналитических вычислений на больших наборах данных обеспечивает ответы с низкой задержкой.
  • Аналитические задачи объединяются в одно задание в памяти без необходимости перезагружать данные или записывать промежуточные результаты на диски.
  • Одновременный доступ к одним и тем же данным в памяти многих пользователей повышает эффективность.
  • Данные и промежуточные результаты хранятся в памяти столько времени, сколько требуется, что снижает задержку.
  • Встроенное управление рабочей нагрузкой обеспечивает эффективное использование вычислительных ресурсов.
  • Встроенное управление отказоустойчивостью гарантирует, что представленные задания всегда завершаются.
  • Автоматическое распространение дискового ввода / вывода для улучшенного управления памятью.

Разработка моделей с использованием современных алгоритмов машинного обучения

  • Деревья принятия решений:
    • Автоматизированный ансамбль деревьев решений для прогнозирования одной цели.
    • Автоматическое распределение независимых тренировочных серий.
    • Поддерживает интеллектуальную автонастройку параметров модели.
    • Автоматическая генерация кода SAS для производственного скоринга.
  • Повышение градиента:
    • Автоматический итеративный поиск для оптимального разделения данных относительно выбранной переменной метки.
    • Автоматическая повторная выборка входных данных несколько раз с корректировкой весов на основе остатков.
    • Автоматическая генерация средневзвешенного значения для окончательной контролируемой модели.
    • Поддерживает двоичные, именные и интервальные метки.
    • Возможность настраивать обучение деревьев с различными вариантами количества деревьев для роста, критериев разделения, глубины поддеревьев и вычислительных ресурсов.
    • Критерии автоматической остановки, основанные на оценке данных проверки, чтобы избежать переобучения.
    • Автоматическая генерация кода SAS для производственного скоринга.
  • Нейронные сети:
    • Автоматическая интеллектуальная настройка набора параметров для определения оптимальной модели.
    • Поддерживает моделирование данных счета.
    • Интеллектуальные настройки по умолчанию для большинства параметров нейронной сети.
    • Возможность настройки архитектуры и веса нейронных сетей.
    • Методы включают нейронную сеть с глубоким переходом (DNN), сверточные нейронные сети (CNN), рекуррентные нейронные сети (RNN) и автоэнкодеры.
    • Возможность использовать произвольное количество скрытых слоев для поддержки глубокого обучения.
    • Поддержка различных типов слоев, таких как свертка и объединение.
    • Автоматическая стандартизация входных и целевых переменных.
    • Автоматический выбор и использование подмножества данных проверки.
    • Автоматическая проверка для ранней остановки, чтобы избежать перегрузки.
    • Поддерживает интеллектуальную автонастройку параметров модели.
    • Автоматическая генерация кода SAS для производственного скоринга.
  • Опорные векторные машины:
    • Модели двоичных целевых меток.
    • Поддерживает линейные и полиномиальные ядра для обучения модели.
    • Возможность включения непрерывных и категоричных функций ввода / вывода.
    • Автоматическое масштабирование входных объектов.
    • Возможность применения метода внутренней точки и метода активного набора.
    • Поддерживает раздел данных для проверки модели.
    • Поддерживает перекрестную проверку для выбора штрафа.
    • Автоматическая генерация кода SAS для производственного скоринга.
  • Факторизация машин:
    • Поддерживает разработку рекомендательных систем на основе разреженных матриц идентификаторов пользователей и рейтингов предметов.
    • Возможность применения полной тензорной факторизации парного взаимодействия.
    • Включает в себя дополнительные категориальные и числовые функции ввода для более точных моделей.
    • Модели с суперзарядом с отметками времени, демографическими данными и контекстной информацией.
    • Поддержка горячего перезапуска (обновление моделей новыми транзакциями без полной переподготовки).
    • Автоматическая генерация кода оценки SAS для производственной оценки.
  • Байесовские сети:
    • Изучает различные структуры байесовской сети, в том числе наивные, дополненные деревьями наивные (TAN), байесовские сети, наивные (BAN), родительские и дочерние байесовские сети и марковское ограждение.
    • Выполняет эффективный выбор переменных с помощью тестов независимости.
    • Выбирает лучшую модель автоматически из указанных параметров.
    • Создает код SAS или хранилище аналитики для оценки данных.
    • Загружает данные из нескольких узлов и выполняет вычисления параллельно.
  • Модели гауссовой смеси Дирихле (GMM):
    • Может выполнять кластеризацию параллельно и является многопоточным.
    • Выполняет мягкую кластеризацию, которая обеспечивает не только предсказанную оценку кластера, но и распределение вероятностей по кластерам для каждого наблюдения.
    • Изучает лучшее количество кластеров в процессе кластеризации, которое поддерживается процессом Дирихле.
    • В качестве метода логического вывода используется параллельный вариационный метод Байеса (VB). Этот метод аппроксимирует (неразрешимое) апостериорное распределение, а затем итеративно обновляет параметры модели, пока не достигнет сходимости.
  • Полуконтролируемый алгоритм обучения:
    • Сильно распределенный и многопоточный.
    • Возвращает предсказанные метки как для таблицы без меток, так и для таблицы данных с метками.
  • Т-распределенное стохастическое вложение соседей (t-SNE):
    • Сильно распределенный и многопоточный.
    • Возвращает низкоразмерные вложения, основанные на параллельной реализации алгоритма t-SNE.

Аналитическая подготовка данных

  • Конструктивный анализ лучших практик включает в себя лучшие преобразования.
  • Распределенные процедуры управления данными, предоставляемые через визуальный интерфейс.
  • Крупномасштабное исследование и обобщение данных.
  • Кардинальное профилирование:
    • Крупномасштабное профилирование данных источников входных данных.
    • Интеллектуальная рекомендация для переменного измерения и роли.
  • Выборка:
    • Поддерживает случайную и стратифицированную выборку, избыточную выборку для редких событий и индикаторные переменные для выборочных записей.

Изучение данных, разработка функций и уменьшение размеров

  • T-распределенное стохастическое вложение соседей (t-SNE).
  • Функция биннинга.
  • Высокопроизводительное вычисление отсутствующих значений в объектах с указанными пользователем значениями, средним значением, псевдомедианой и случайным значением не пропущенных значений
  • Уменьшение размеров элемента.
  • Крупномасштабный анализ основных компонентов (PCA), включая движущиеся окна и надежный PCA.
  • Обучение без учителя с кластерным анализом и смешанной переменной кластеризации.
  • Сегментные профили для кластеризации.

Интегрированная аналитика текста

  • Поддерживает 33 родных языка:
    • английский
    • арабский
    • китайский
    • хорватский
    • чешский
    • датский
    • нидерландский
    • фарси
    • финский
    • французкий
    • немецкий
    • греческий
    • иврит
    • хинди
    • венгерский
    • индонезийский
    • итальянский
    • японский
    • казахский
    • корейский
    • норвежский
    • польский
    • португальский
    • румынский
    • русский
    • словацкий
    • словенский
    • испанский
    • шведский
    • тагальского
    • турецкий
    • тайский
    • вьетнамский
  • Стоп-листы автоматически включаются и применяются для всех языков.
  • Автоматизированный анализ, токенизация, маркировка части речи и лемматизация.
  • Предопределенные концепции извлекают общие объекты, такие как имена, даты, значения валют, измерения, люди, места и многое другое.
  • Автоматическое извлечение признаков с помощью сгенерированных машиной тем (разложение по сингулярным значениям и скрытое распределение Дирихле).
  • Поддерживает машинное обучение и основанные на правилах подходы в рамках одного проекта.
  • Автоматическая генерация правил с помощью BoolRule.
  • Точная классификация документов с глубоким обучением (периодические нейронные сети).

Модель оценки

  • Автоматически рассчитывает статистику производительности модели обучения под наблюдением.
  • Производит выходную статистику для интервальных и категориальных целей.
  • Создает таблицу подъема для интервала и категориальной цели.
  • Создает таблицу ROC для категориальной цели.
  • Создает диаграммы событийной и номинальной классификации для моделей обучения под наблюдением с целевым классом.

Оценка модели

  • Автоматически генерирует код шага SAS DATA для скоринга модели.
  • Применяет логику скоринга к тренировкам, несогласованным данным и новым данным.

SAS ® Viya ® в памяти системы

  • CAS (SAS Cloud Analytic Services) выполняет обработку в памяти и распределяет обработку по узлам в кластере.
  • Пользовательские запросы (выраженные на процедурном языке) переводятся в действия с параметрами, необходимыми для обработки в распределенной среде. Набор результатов и сообщения передаются обратно в процедуру для дальнейших действий пользователем.
  • Данные управляются блоками и могут быть загружены в память и по запросу.
  • Если таблицы превышают объем памяти, сервер кэширует блоки на диске. Данные и промежуточные результаты хранятся в памяти столько времени, сколько требуется, через задания и границы пользователя.
  • Включает высокоэффективную связь между узлами. Алгоритм определяет оптимальное количество узлов для данной работы.
  • Коммуникационный уровень поддерживает отказоустойчивость и позволяет удалять или добавлять узлы с сервера во время его работы. Все компоненты могут быть реплицированы для обеспечения высокой доступности.
  • Поддержка устаревшего кода SAS и прямая совместимость с клиентами SAS 9.4M6.
  • Поддерживает многопользовательское развертывание, что позволяет совместно используемому программному стеку защищать изолированных пользователей.

Варианты развертывания

  • Развертывания на месте:
    • Сервер с одним компьютером для удовлетворения потребностей малых и средних организаций.
    • Распределенный сервер для удовлетворения растущих данных, увеличения рабочих нагрузок и требований к масштабируемости.
  • Облачные развертывания:
    • Корпоративный хостинг.
    • Частная или публичная облачная инфраструктура (например, BYOL в Amazon).
    • Управляемое программное обеспечение SAS как услуга (SaaS).
    • Платформа Cloud Foundry как услуга (PaaS) для поддержки нескольких облачных провайдеров.

Streamlined model deployment

  • Streamlines the process of creating, managing, administering, deploying and monitoring your analytical models.
  • Provides a framework for model registration, validation, monitoring and retraining.
  • Enables you to assess candidate models to identify and publish the champion model.
  • Ensures complete auditability and regulatory compliance.

View more streamlined model deployment features

Регистрация модели

  • Обеспечивает безопасное, надежное хранилище версий для всех типов моделей, а также администрирование доступа, включая возможности резервного копирования и восстановления, защиту от перезаписи и ведение журнала событий.
  • После регистрации модели можно искать, опрашивать, сортировать и фильтровать по атрибутам, используемым для их хранения - типу актива, алгоритму, входным или целевым переменным, идентификатору модели и т.д., а также заданным пользователем корректным и редактируемым ключевым словам.
  • Добавьте общие свойства в виде столбцов к списку для моделей и проектов, такие как имя модели, роль, тип алгоритма, дата изменения, изменения, местоположение хранилища, описание, версия и ключевые слова (теги).
  • Получать доступ к моделям и артефактам оценки модели с помощью открытых API REST.
  • Непосредственно поддерживает модели Python для скоринга и публикации. Преобразуйте PMML и ONNX (используя dlPy) в стандартные типы моделей SAS. Управление и версия кода R, как и другие типы кода.
  • Обеспечивает учет и возможность аудита, включая регистрацию событий основных действий, например, создание модели, создание проекта и публикация.
  • Экспорт моделей в формате .ZIP, включая все содержимое файла модели для перемещения по средам.
  • С легкостью копируйте модели из одного проекта в другой, упрощая перемещение моделей в хранилище.

Аналитическое управление рабочим процессом

  • Создайте пользовательские процессы для каждой модели с помощью SAS Workflow Studio:
    • Менеджер рабочих процессов полностью интегрирован с SAS Model Manager, поэтому вы можете управлять рабочими процессами и отслеживать задачи рабочих процессов в одном и том же пользовательском интерфейсе.
    • Импортируйте, обновляйте и экспортируйте общие модели на уровне папок, а также дублируйте их или перемещайте в другую папку.
  • Облегчает сотрудничество между группами с помощью автоматических уведомлений.
  • Выполнять общие задачи управления моделями, такие как импорт, просмотр и присоединение сопроводительной документации; установка модели чемпиона проекта и пометка моделей претендента; публикация моделей для целей оценки; и просмотр отчетов панели инструментов.

Оценка модели

  • Поместите комбинацию моделей Python, SAS или других моделей с открытым исходным кодом в один и тот же проект, чтобы пользователи могли сравнивать и оценивать их с использованием различных статистик соответствия модели.
  • Настройка, поддержка и управление отдельными версиями для моделей:
    • Модель чемпиона автоматически определяется как новая версия, когда модель устанавливается как чемпион, обновляется или публикуется в проекте.
    • Выберите модели претендента на модель чемпиона проекта.
    • Отслеживайте и публикуйте модели претендентов и чемпионов.
  • Определение заданий тестирования и оценки производительности для моделей SAS и Python с использованием требуемых входных и выходных данных.
  • Создайте и выполните задачи скоринга, а также укажите, где сохранить выходные данные и историю заданий.

Развертывание модели

  • В зависимости от варианта использования вы можете публиковать модели в пакетных / операционных системах, например, на сервере SAS, в базе данных, на сервере Hadoop / Spark, на сервере SAS Cloud Analytic Services (CAS) или в системах по требованию с помощью Micro Analytic Score. (MAS) сервис.
  • Публикация моделей Python и SAS для запуска временных контейнеров со встроенными двоичными файлами и файлами с кодовыми оценками. Продвижение тайм-контейнеров в локальных средах Docker, AWS Docker и Amazon EKS (эластичный кубернетный сервис).

Мониторинг модели

  • Мониторинг производительности моделей с любым типом кода оценки. Отчеты о производительности, подготовленные для моделей R, Python и SAS чемпиона и претендента, включают графики переменного распределения, диаграммы подъема, диаграммы устойчивости, отчеты ROC, KS и Gini с помощью SAS Visual Analytics с использованием выходных наборов отчетов о производительности.
  • Встроенные отчеты отображают меры для входных и выходных данных, а также согласуются со статистикой для классификационных и регрессионных моделей, чтобы оценить, следует ли переучивать, выводить из эксплуатации или создавать новые модели. Отчеты о производительности для чемпиона и претендента аналитические модели с участием Python, SAS, R и т.д., с различной точностью статистики доступны.
  • Мониторинг производительности моделей-чемпионов для всех проектов с использованием определения и выполнения отчета о производительности.
  • Расписание повторяющихся и будущих заданий для мониторинга производительности.
  • Укажите несколько источников данных и периодов сбора данных при определении задач мониторинга производительности.

Self-service data preparation

  • Provides an interactive, self-service environment for data access, blending, shaping and cleansing to prepare data for analytics and reporting.
  • Fully integrates with your analytics pipeline.
  • Includes data lineage and automation.

View more self-service data preparation features

Data & metadata access

  • Use any authorized internal source, accessible external data sources and data held in-memory in SAS Viya.
    • View a sample of a table or file loaded in the in-memory engine of SAS Viya, or from data sources registered with SAS/ACCESS, to visualize the data you want to work with.
    • Quickly create connections to and between external data sources.
    • Access physical metadata information like column names, data types, encoding, column count and row count to gain further insight into the data.
  • Data sources and types include:
    • Amazon S3.
    • Amazon Redshift.
    • DNFS, HDFS, PATH-based files (CSV, SAS, Excel, delimited).
    • DB2.
    • Hive.
    • Impala.
    • SAS® LASR.
    • ODBC.
    • Oracle.
    • Postgres.
    • Teradata.
    • Feeds from Twitter, YouTube, Facebook, Google Analytics, Google Drive, Esri and local files.
    • SAS® Cloud Analytic Services (CAS).

Data provisioning 

  • Parallel load data from desired data sources into memory simply by selecting them – no need to write code or have experience with an ETL tool. (Data cannot be sent back to the following data sources: Twitter, YouTube, Facebook, Google Analytics, Esri; it can only be sourced form these sites).
    • Reduce the amount of data being copied by performing row filtering or column filtering before the data is provisioned.
    • Retain big data in situ, and push processing to the source system by including SAS In-Database optional add-ons.

    Guided, interactive data preparation

    • Transform, blend, shape, cleanse and standardize data in an interactive, visual environment that guides you through data preparation processes.
    • Easily understand how a transformation affected results, getting visual feedback in near-real-time through the distributed, in-memory processing of SAS Viya.

    Machine learning & AI suggestions

    • Take advantage of AI and machine learning to scan data and make intelligent transformation suggestions.
    • Accept suggestions and complete transformations at the click of a button. No advanced or complex coding required.
    • Automated suggestions include:
      • Casing.
      • Gender analysis.
      • Match code.
      • Parse.
      • Standardization.
      • Missing value imputation for numeric variables.
      • One hot encoding.
      • Remove column.
      • Whitespace trimming.
      • Convert column data type.
      • Center and scale.
      • Dedupe.
      • Unique ID creation.
      • Column removal for sparse data.

    Column-based transformations

    • Use column-based transformations to standardize, remediate and shape data without doing configurations. You can:
      • Change case.
      • Convert column.
      • Rename.
      • Remove.
      • Split.
      • Trim whitespace.
      • Custom calculation.
    • Support for wide tables allows for the saving of data plans for quick data preparation jobs.

    Row-based transformations

    • Use row-based transformations to filter and shape data.
    • Create analytical-based tables using the transpose transformation to prepare the data for analytics and reporting tasks.
    • Create simple or complex filters to remove unnecessary data.

    Code-based transformations

    • Write custom code to transform, shape, blend, remediate and standardize data.
    • Write simple expressions to create calculated columns, write advanced code or reuse code snippets for greater transformational flexibility.
    • Import custom code defined by others, sharing best practices and collaborative productivity.

    Multiple-input-based transformations

    • Use multiple-input-based transformations to blend and shape data.
    • Blend or shape one or more sets of data together using the guided interface – there’s no requirement to know SQL or SAS. You can:
      • Append data.
      • Join data.
      • Transpose data.

    Data profiling

    • Profile data to generate column-based and table-based basic and advanced profile metrics.
    • Use the table-level profile metrics to uncover data quality issues and get further insight into the data itself.
    • Drill into each column for column-level profile metrics and to see visual graphs of pattern distribution and frequency distribution results that help uncover hidden insights.
    • Use a variety of data types/sources (listed previously). To profile data from Twitter, Facebook, Google Analytics or YouTube, you must first explicitly import the data into the SAS Viya in-memory environment.

    Data quality processing

    (SAS® Data Quality in SAS® Viya® is included in SAS Data Preparation)

    Data cleansing

    • Use locale- and context-specific parsing and field extraction definitions to reshape data and uncover additional insights.
    • Use the extraction transformation to identify and extract contact information (e.g., name, gender, field, pattern, identify, email and phone number) in a specified column.
    • Use parsing when data in a specified column needs to be tokenized into substrings (e.g., a full name tokenized into prefix, given name, middle name and family name).
    • Derive unique identifiers from match codes that link disparate data sources.
    • Standardize data with locale- and context-specific definitions to transform data into a common format, like casing.

    Identity definition

    • Analyze column data using locale-specific rules to determine gender or context.
    • Use identification analysis to analyze the data and determine its context, which is particularly valuable if the data or source of data is unfamiliar.
    • Use gender analysis to determine the gender of a name using locale-specific rules so the data can be easily filtered or segmented.
    • Create a unique ID for each row with unique ID generator.
    • Identify the subject data in each column with identification analysis.
    • Identify, find and sort data by tagging data with columns and tables.

    Data matching

    • Determine matching records based upon locale- and context-specific definitions.
    • Easily identify matching records using more than 25 context-specific rules such as date, address, name, email, etc.
    • Use the results of the match code transformation to remove duplicates, perform a fuzzy search or a fuzzy join.
    • Find like records and logically group together.

    System & job monitoring

    • Use integrated monitoring capabilities for system- and job-level processes.
    • Gain insight into how many processes are running, how long they’re taking and who is running them.
    • Easily filter through all system jobs based on job status (running, successful, failed, pending and cancelled).
    • Access job error logs to help with root-cause analysis and troubleshooting. (Note: Monitoring is available using SAS Environment Manager and the job monitor application.)

    Data import & data preparation job scheduling

    • Create a data import job from automatically generated code to perform a data refresh using the integrated scheduler.
    • Schedule data explorer imports as jobs so they will become an automatic, repeatable process.
    • Specify a time, date, frequency and/or interval for the jobs.

    Data lineage

    • Explore relationships between accessible data sources, data objects and jobs.
    • Use the relationship graph to visually show the relationships that exist between objects, making it easier to understand the origin of data and trace its processing.
    • Create multiple views with different tabs, and save the organization of those views.

    Plan templates & project collaboration

    • Use data preparation plans (templates), which consist of a set of transformation rules that get applied to one or more sources of data, to improve productivity (spend less time preparing data).
    • Reuse the templates by applying them to different sets of data to ensure that data is transformed consistently to adhere to enterprise data standards and policies.
    • Rely on team-based collaboration through a project hub used with SAS Viya projects. The project’s activity feed shows who did what and when, and can be used to communicate with other team members.

    Batch text analysis

    • Quickly extract contents of documents, and perform text identification and extraction.

    Cloud data exchange

    • Securely copy data from on-site repositories to a cloud-based SAS Viya instance running in a private or public cloud for use in SAS Viya applications – as well as sending data back to on-site locations.
    • Preprocess data locally, which reduces the amount of data that needs to be moved to remote locations.
    • Use a Command Line Input (CLI) interface for administration and control.
    • Securely and responsibly negotiates your on-site firewall.  

    Visual data exploration & insights development

    • Provides bi-modal support for both governed and self-service exploration and visualization.
    • Enables self-service discovery, reporting and analysis.
    • Provides access to easy-to-use predictive analytics with “smart algorithms.”
    • Enables report sharing via email, web browser, MS Office or mobile devices.
    • Provides centralized, web-based administration, monitoring and governance of platform.

    View more visual data exploration & insights development features

    Данные

    • Импорт данных из различных источников: базы данных, электронные таблицы Hadoop, Excel, социальные сети и т. д.
    • Перетаскивайте файл Excel, набор данных CSV или SAS в свое рабочее пространство и быстро приступайте к созданию отчетов или панелей мониторинга.
    • Используйте стандартные функции качества данных, такие как изменение регистра; конвертируйте, переименовывайте, удаляйте и разбивайте столбцы; создавайте вычисляемые столбцы и преобразования, используя пользовательский код.
    • Подготовьте данные с помощью функций добавления, объединения, фильтрации и транспонирования.
    • Используйте повторно, планируйте и мониторьте задания.
    • Просматривайте линии с сетевыми диаграммами.
    • Просматривайте описательную статистику о мерах оперативно, чтобы увидеть характеристики ваших данных.
    • Создайте рассчитанные, агрегированные или производные элементы данных.
    • Создавайте развертываемые иерархии в режиме самообслуживания без необходимости заранее определять пути пользователя.

    Открытия

    • Интерактивное обнаружение данных позволяет бизнес-пользователям и аналитикам легко определять отношения, тенденции, выбросы и т. д.
    • Точные и адаптивные возможности макета. Вы можете складывать или группировать предметы и многое другое.
    • Включены различные графические объекты или диаграммы:
      • Бар.
      • Сектор.
      • Кольцевая диаграмма.
      • Линия.
      • Разброс данных.
      • Тепловая карта.
      • Круг.
      • Анимированный круг.
      • Древовидная карта.
      • Точка.
      • Игла.
      • Числовая серия.
      • План-график.
      • Вектор.
      • Ключевая ценность инфографики.
      • И многое другое с гибкими возможностями построения графиков.
    • Добавьте контент из Интернета (например, видео YouTube, веб-приложения) и изображения (например, логотипы) в свой отчет.
    • Пользовательская сортировка позволяет ранжировать элементы данных категории заказа в таблице или графике по характеристикам (например, товары, клиенты). Характеристики, которые наиболее важны для вашей организации, будут отображаться первыми.
    • Фильтрация одним щелчком (например, односторонний, двунаправленный) и связанные варианты выбора позволят вам тратить меньше времени на ручную привязку контента (например, визуализации, отчетов).
    • Текстовые объекты включают текст на основе данных или сгенерированный системой для соответствующего контекста.
    • Синхронизируйте выбор и фильтры по визуализациям в отчете или на панели мониторинга.
    • Свяжите различные отчеты (например, отчет о продажах с отчетом об инвентаризации).
    • Получатели отчетов могут изменять параметры вычислений и правила отображения, используя элементы управления, фильтры и т. д., чтобы просмотреть наиболее актуальную для них информацию.
    • Получатели отчетов могут переключать измерения и менять тип диаграммы и форматирование мгновенно, что позволяет им быстро принимать важные бизнес-решения.
    • Установите частоту обновления для отдельных объектов, страниц или всего отчета.
    • Аналитические визуализации включают в себя:
      • Блочная диаграмма.
      • Тепловая карта.
      • Анимированная пузырьковая диаграмма.
      • Диаграмма сети.
      • Корреляционная матрица.
      • Прогнозирование.
      • График параллельных координат.
      • Древо решений.
      • И многое другое с гибкими возможностями построения графиков.
    • Просмотр географических карт позволяет быстро получить представление о геопространственных данных, в том числе о времени проезда и расстоянии до места назначения. Демографические данные обогащаются благодаря интеграции с Исследовательским институтом геоинформационных систем ESRI.
    • Сетевые диаграммы позволяют отображать сети на карте.
    • Добавьте свои собственные интерактивные визуализации (например, графики D3.js, визуализации C3 или диаграммы Google) в SAS Visual Analytics, чтобы все они управлялись одними и теми же данными.
    • Визуализация значения ключа позволяет отображать важные метрики (числовые или категориальные значения) в стиле инфографики для быстрого ознакомления.
    • Визуализация ключевых значений позволяет отобразить важные метрики (числовые или категориальные значения) в инфографическом стиле для быстрого обращения.
    • Добавьте визуализации ячеек, такие как столбцы и тепловые карты, в свои таблицы, чтобы быстро определить проблемные точки и увидеть тенденции в ваших данных.
    • Создание прогнозов в процессе работы с включенными доверительными интервалами.
    • Наиболее подходящая модель прогнозирования выбирается автоматически после запуска нескольких моделей с данными.
    • Анализ сценариев позволяет увидеть, как изменения различных переменных повлияют на прогнозы.
    • Поиск цели позволяет вам указать целевое значение для вашего прогноза, а затем определить значения базовых факторов, которые потребуются для достижения целевого значения.
    • Дерево решений графически отображает вероятные результаты.
    • Пользовательское бинирование перемещает непрерывные данные в небольшое число групп для лучшей интерпретации и представления результатов.
    • Функции анализа текста позволяют автоматически находить темы и понимать настроения из текстовых источников, включая Facebook, Twitter, Google Analytics, комментарии YouTube и многое другое.
    • Восстановление отчетов, которые вы редактируете, когда ваша сессия неожиданно заканчивается. Отчеты автоматически сохраняются каждые пять секунд после внесения изменений.
    • Продолжайте с того места, где вы остановились на предыдущей сессии на всех ваших устройствах.

    Расширенная аналитика

    • Autocharting автоматически выбирает график, наиболее подходящий для отображения выбранных данных.
    • Автоматическое объяснение определяет, какие переменные влияют на результат, и предоставляет простое объяснение на естественном языке, которое легко понять.
    • Автоматическое объяснение позволяет быстро обнаруживать и выделять закономерности и выбросы в ваших данных.
    • Автоматическое объяснение определяет ключевое различие между верхним и нижним случаями в данных. Например, что лучше всего отличает случаи с наименьшим и наибольшим риском?
    • Шаги, предпринятые для автоматического объяснения ваших данных, отображаются для прозрачности.
    • Используйте автоматическое объяснение, чтобы определить интересные группы на основе выбранных вами факторов.
    • Автоматически создает интерактивную аналитическую историю на основе всех ваших данных, готовых к публикации.
    • Предлагаемая информация, автоматически полученная из ваших данных, позволяет быстро создавать информативные отчеты и информационные панели.
    • Связанные показатели выделены в списке показателей, чтобы пользователи могли быстро определить потенциальные взаимодействия.

    Делиться и сотрудничать

    • Повторное использование и совместное использование модификаций отчета, таких как фильтры, вычисления, иерархии и форматирование элементов отчета.
    • Совместная работа на мобильных устройствах и в Интернете путем добавления комментариев к отчету.
    • Создайте оповещения для получателей отчета, чтобы подписчики получали уведомление по электронной почте или в текстовом сообщении при соблюдении порогового условия.
    • Распространяйте отчеты в формате PDF или по электронной почте безопасным способом. Распространяйте отчеты один раз или через определенные промежутки времени, например, ежедневно, еженедельно или ежемесячно.
    • Воспроизводимые информационные панели позволяют переводить отчет в режим слайд-шоу.
    • Администраторы могут настроить поддержку гостевого доступа для просмотра отчетов или визуализации.
    • Гостевые пользователи могут просматривать идеи, которые доступны для общественности.
    • Пользователи могут видеть, организовывать и сотрудничать в своей работе с помощью SAS Drive:
      • Пользователи могут добавлять в избранное, делиться, просматривать и отмечать свой контент из одного места.
      • Создавайте проекты, которые совместно используют данные, контент и другие ресурсы с участниками проекта.

    Приложения SAS ® Visual Analytics

    • Получить бесплатно:
      • Магазин приложений для iOS iPhone и iPad.
      • Google Play для телефонов и планшетов Android.
      • Магазин Microsoft для устройств Windows 10.
    • Приложение позволяет вам подключаться и взаимодействовать с вашими отчетами SAS Visual Analytics и инструментальными панелями, используя жесты, присущие вашим устройствам.
    • Взаимодействуйте с приложением SAS Visual Analytics для iOS с помощью голосовых команд.
    • Отчеты, созданные в SAS Visual Analytics, можно просматривать где угодно.
    • Получите безопасный доступ к контенту на мобильных устройствах, как онлайн, так и офлайн.
    • Аннотируйте, комментируйте, делитесь и отправляйте отчеты по электронной почте другим для расширения сотрудничества.
    • Снимки экрана могут быть запечатлены, а комментарии - переданы другим.
    • Уведомления предупреждают бизнес-пользователей об обновлении отчета, изменении данных или обновлении приложения.

    Встроенные идеи

    • Создайте свои собственные мобильные приложения, используя SAS SDK для iOS и SAS SDK для Android, чтобы создавать встроенные идеи:
      • Персонализируйте свое мобильное приложение с помощью встроенного контента SAS Visual Analytics, фирменного логотипа и названия по вашему выбору.
      • Предварительно настройте мобильное приложение для подключения к серверам SAS и подписки на указанные отчеты.
      • Разрабатывайте полностью настраиваемые мобильные приложения, которые встраивают контент SAS Visual Analytics (например, GatherIQ).
      • Управляйте мобильными приложениями и данными и защищайте их, интегрируя их со службой управления мобильными устройствами (через новые API).
    • Встраивайте полные отчеты или отдельные объекты на веб-сайты и в веб-приложения с помощью SAS Visual Analytics SDK:
      • Объедините идеи из нескольких отчетов в одном месте.
      • Выбор пользователя во встроенном объекте SAS Visual Analytics может управлять другими элементами в любом месте веб-страницы.

    Аналитика местоположения

    • Географические карты активируются через Esri ArcGIS Online или OpenStreetMap.
    • Вы можете наносить лассо-данные на географические карты, чтобы выбрать конкретные данные для дальнейшего анализа.
    • Географические карты позволяют легко визуализировать отклонения измерений по географическому району.
    • Доступ ко всем базовым картам и геоисследованиям Esri предоставляется через Esri ArcGIS Online без дополнительной оплаты.
    • Пользовательские многоугольники (например, территории продаж, избирательные участки, планы этажей, схемы рассадки) позволят вам увидеть мир так, как этого требует ваш бизнес. Эти полигоны можно анимировать, чтобы показать, как ключевые показатели меняются со временем.
    • Кластеризация географических точек упрощает визуализацию больших объемов данных о местоположении и определение областей интереса. Получите больше или меньше деталей на разных уровнях масштабирования.
    • Добавьте булавки к карте, чтобы отметить на ней интересные места и сведения.
    • С лицензией Esri ArcGIS Online вы можете дополнить свои данные демографическими данными Исследовательского института геоинформационных систем ESRI:
      • Начните с булавки и выберите область, которую можно проехать, исходя из расстояния или предусмотренного времени в пути.
      • Создавайте маршруты движения между точками.
      • Поймите, как местоположение влияет на результаты, геокодируя свои данные, добавляя столбцы широты и долготы к вашим данным на основе информации о местоположении в ваших данных (страна, штат, почтовый индекс, город, улица).

    Безопасность и администрирование

    • SAS Environment Manager обеспечивает простое в использовании централизованное веб-администрирование и мониторинг среды BI и аналитики, включая пользователей, данные, контент, серверы, службы и безопасность.
    • Аутентификация пользователей и авторизация контента поддерживают управление.
    • Безопасность на уровне объектов (папки, отчеты и т. Д.) И безопасность данных (на уровне таблиц и строк) поддерживают управление.
    • Полная интеграция с каталогами фирменного стиля, такими как LDAP.
    • Возможности приложений с отображением правил для пользователей и групп поддерживают управление.
    • Белый или черный список мобильных устройств для определения авторизации приложений SAS Visual Analytics.
    • Приборная панель в режиме реального времени для мониторинга работоспособности системы и ключевых видов деятельности.
    • Добавление и удаление узлов распределенной обработки.
    • Скриптовые API выполняют административные задачи пакетно, включая управление безопасностью, библиотеками, группами пользователей и конфигурациями.
    • Настраиваемые отчеты по мониторингу и производительности.
    • Экологическое исследование журнала, планирование работы и мониторинг.

    Движок оперативной памяти SAS ® Viya ®

    • CAS (SAS Cloud Analytic Services) выполняет обработку в памяти и распределяет обработку по узлам в кластере.
    • Пользовательские запросы (выраженные на процедурном языке) переводятся в действия с параметрами, необходимыми для обработки в распределенной среде. Набор результатов и сообщения передаются обратно в процедуру для дальнейших действий пользователем.
    • Данные управляются блоками и могут быть загружены в память и по запросу.
    • Если таблицы превышают объем памяти, сервер кэширует блоки на диске. Данные и промежуточные результаты хранятся в памяти столько времени, сколько требуется, для разных заданий и пользователей.
    • Включает высокоэффективную связь между узлами. Алгоритм определяет оптимальное количество узлов для данной работы.
    • Коммуникационный уровень поддерживает отказоустойчивость и позволяет удалять или добавлять узлы с сервера во время его работы. Все компоненты могут быть реплицированы для обеспечения высокой доступности.
    • Поддержка устаревшего кода SAS и прямая совместимость с клиентами SAS 9.4M5.
    • Поддерживает многопользовательское развертывание, что позволяет совместно используемому программному стеку защищать изолированных пользователей.

    Гибкость развертывания

    • Развертывания на месте:
      • Одномашинный сервер для поддержки потребностей малых и средних компаний.
      • Распределенный сервер для удовлетворения растущих данных, увеличения рабочих нагрузок и требований к масштабируемости.
    • Облачные развертывания:
      • Корпоративный хостинг.
      • Частная или публичная облачная инфраструктура (например, BYOL в Amazon).
      • Управляемое программное обеспечение SAS как услуга (SaaS).
      • Платформа Cloud Foundry как услуга (PaaS) для поддержки нескольких облачных провайдеров.

    Descriptive & predictive modeling

    • Explore and evaluate segments for further analysis using k-means clustering, scatter plots and detailed summary statistics.
    • Use machine learning techniques to build predictive models from a visual or programming interface.

    View more descriptive & predictive modeling features

    Visual data exploration & discovery (available through SAS® Visual Analytics) 

    • Quickly interpret complex relationships or key variables that influence modeling outcomes within large data sets.
    • Filter observations and understand a variable’s level of influence on overall model lift. 
    • Detect outliers and/or influence points to help you determine, capture and remove them from downstream analysis (e.g., models). 
    • Explore data using bar charts, histograms, box plots, heat maps, bubble plots, geographic maps and more. 
    • Derive predictive outputs or segmentations that can be used directly in other modeling or visualization tasks. Outputs can be saved and passed to those without model-building roles and capabilities.
    • Automatically convert measure variables with two levels to category variables when a data set is first opened.

    Visual interface access to analytical techniques

    • Clustering:
      • K-means, k-modes or k-prototypes clustering.
      • Parallel coordinate plots to interactively evaluate cluster membership.
      • Scatter plots of inputs with cluster profiles overlaid for small data sets and heat maps with cluster profiles overlaid for large data sets.
      • Detailed summary statistics (means of each cluster, number of observations in each cluster, etc.).
      • Generate on-demand cluster ID as a new column.
      • Supports holdout data (training and validation) for model assessment. 
    • Decision trees: 
      • Supports classification and regression trees. 
      • Based on a modified C4.5 algorithm or cost-complexity pruning. 
      • Interactively grow and prune a tree. Interactively train a subtree. 
      • Set tree depth, max branch, leaf size, aggressiveness of tree pruning and more. 
      • Use tree map displays to interactively navigate the tree structure. 
      • Generate on-demand leaf ID, predicted values and residuals as new columns. 
      • Supports holdout data (training and validation) for model assessment.
      • Supports pruning with holdout data.
      • Supports autotuning with options for leaf size.
    • Linear regression: 
      • Influence statistics.
      • Supports forward, backward, stepwise and lasso variable selection.
      • Iteration plot for variable selection.
      • Frequency and weight variables.
      • Residual diagnostics.
      • Summary table includes overall ANOVA, model dimensions, fit statistics, model ANOVA, Type III test and parameter estimates.
      • Generate on-demand predicted values and residuals as new columns.
      • Support holdout data (training and validation) for model assessment.
    • Logistic regression:
      • Models for binary data with logit and probit link functions.
      • Influence statistics.
      • Supports forward, backward, stepwise and lasso variable selection.
      • Iteration plot for variable selection.
      • Frequency and weight variables.
      • Residual diagnostics.
      • Summary table includes model dimensions, iteration history, fit statistics, convergence status, Type III tests, parameter estimates and response profile.
      • Generate on-demand predicted labels and predicted event probabilities as new columns. Adjust the prediction cutoff to label an observation as event or non-event.
      • Support holdout data (training and validation) for model assessment.
    • Generalized linear models:
      • Distributions supported include beta, normal, binary, exponential, gamma, geometric, Poisson, Tweedie, inverse Gaussian and negative binomial.
      • Supports forward, backward, stepwise and lasso variable selection.
      • Offset variable support.
      • Frequency and weight variables.
      • Residual diagnostics.
      • Summary table includes model summary, iteration history, fit statistics, Type III test table and parameter estimates.
      • Informative missing option for treatment of missing values on the predictor variable.
      • Generate on-demand predicted values and residuals as new columns.
      • Supports holdout data (training and validation) for model assessment.
    • Generalized additive models:
      • Distributions supported include normal, binary, gamma, Poisson, Tweedie, inverse Gaussian and negative binomial.
      • Supports one- and two-dimensional spline effects.
      • GCV, GACV and UBRE methods for selecting the smoothing effects.
      • Offset variable support.
      • Frequency and weight variables.
      • Residual diagnostics.
      • Summary table includes model summary, iteration history, fit statistics and parameter estimates.
      • Supports holdout data (training and validation) for model assessment.
    • Nonparametric logistic regression:
      • Models for binary data with logit, probit, log-log and c-log-log link functions.
      • Supports one- and two-dimensional spline effects.
      • GCV, GACV and UBRE methods for selecting the smoothing effects.
      • Offset variable support.
      • Frequency and weight variables.
      • Residual diagnostics.
      • Summary table includes model summary, iteration history, fit statistics and parameter estimates.
      • Supports holdout data (training and validation) for model assessment.

    Programming access to analytical techniques

    • Programmers and data scientists can access SAS Viya (CAS server) from SAS Studio using SAS procedures (PROCs) and other tasks.
    • Programmers can execute CAS actions using PROC CAS or use different programming environments like Python, R, Lua and Java.
    • Users can also access SAS Viya (CAS server) from their own applications using public REST APIs.
    • Provides native integration to Python Pandas DataFrames. Python programmers can upload DataFrames to CAS and fetch results from CAS as DataFrames to interact with other Python packages, such as Pandas, matplotlib, Plotly, Bokeh, etc.
    • Includes SAS/STAT® and SAS/GRAPH® software.
    • Principal component analysis (PCA):
      • Performs dimension reduction by computing principal components.
      • Provides the eigenvalue decomposition, NIPALS and ITERGS algorithms.
      • Outputs principal component scores across observations.
      • Creates scree plots and pattern profile plots.
    • Decision trees:
      • Supports classification trees and regression trees.
      • Supports categorical and numerical features.
      • Provides criteria for splitting nodes based on measures of impurity and statistical tests.
      • Provides the cost-complexity and reduced-error methods of pruning trees.
      • Supports partitioning of data into training, validation and testing roles.
      • Supports the use of validation data for selecting the best subtree.
      • Supports the use of test data for assessment of final tree model.
      • Provides various methods of handling missing values, including surrogate rules.
      • Creates tree diagrams.
      • Provides statistics for assessing model fit, including model-based (resubstitution) statistics.
      • Computes measures of variable importance.
      • Outputs leaf assignments and predicted values for observations.
    • Clustering:
      • Provides the k-means algorithm for clustering continuous (interval) variables.
      • Provides the k-modes algorithm for clustering nominal variables.
      • Provides various distance measures for similarity.
      • Provides the aligned box criterion method for estimating the number of clusters.
      • Outputs cluster membership and distance measures across observations.
    • Linear regression:
      • Supports linear models with continuous and classification variables.
      • Supports various parameterizations for classification effects.
      • Supports any degree of interaction and nested effects.
      • Supports polynomial and spline effects.
      • Supports forward, backward, stepwise, least angle regression and lasso selection methods.
      • Supports information criteria and validation methods for controlling model selection.
      • Offers selection of individual levels of classification effects.
      • Preserves hierarchy among effects.
      • Supports partitioning of data into training, validation and testing roles.
      • Provides a variety of diagnostic statistics.
      • Generates SAS code for production scoring.
    • Logistic regression:
      • Supports binary and binomial responses.
      • Supports various parameterizations for classification effects.
      • Supports any degree of interaction and nested effects.
      • Supports polynomial and spline effects.
      • Supports forward, backward, fast backward and lasso selection methods.
      • Supports information criteria and validation methods for controlling model selection.
      • Offers selection of individual levels of classification effects.
      • Preserves hierarchy among effects.
      • Supports partitioning of data into training, validation and testing roles.
      • Provides variety of statistics for model assessment.
      • Provides variety of optimization methods for maximum likelihood estimation.
    • Generalized linear models:
      • Supports responses with a variety of distributions, including binary, normal, Poisson and gamma.
      • Supports various parameterizations for classification effects.
      • Supports any degree of interaction and nested effects.
      • Supports polynomial and spline effects.
      • Supports forward, backward, fast backward, stepwise and group lasso selection methods.
      • Supports information criteria and validation methods for controlling model selection.
      • Offers selection of individual levels of classification effects.
      • Preserves hierarchy among effects.
      • Supports partitioning of data into training, validation and testing roles.
      • Provides variety of statistics for model assessment.
      • Provides a variety of optimization methods for maximum likelihood estimation.
    • Nonlinear regression models:
      • Fits nonlinear regression models with standard or general distributions.
      • Computes analytical derivatives of user-provided expressions for more robust parameter estimations.
      • Evaluates user-provided expressions using the ESTIMATE and PREDICT statements (procedure only).
      • Requires a data table that contains the CMP item store if not using PROC NLMOD.
      • Estimates parameters using the least squares method.
      • Estimates parameters using the maximum likelihood method.
    • Quantile regression models:
      • Supports quantile regression for single or multiple quantile levels.
      • Supports multiple parameterizations for classification effects.
      • Supports any degree of interactions (crossed effects) and nested effects.
      • Supports hierarchical model selection strategy among effects.
      • Provides multiple effect-selection methods.
      • Provides effect selection based on a variety of selection criteria.
      • Supports stopping and selection rules.
    • Predictive partial least squares models:
      • Provides programming syntax with classification variables, continuous variables, interactions and nestings.
      • Provides effect-construction syntax for polynomial and spline effects.
      • Supports partitioning of data into training and testing roles.
      • Provides test set validation to choose the number of extracted factors.
      • Implements the following methods: principal component regression, reduced rank regression and partial least squares regression.
    • Generalized additive models:
      • Fit generalized additive models based on low-rank regression splines.
      • Estimates the regression parameters by using penalized likelihood estimation.
      • Estimates the smoothing parameters by using either the performance iteration method or the outer iteration method.
      • Estimates the regression parameters by using maximum likelihood techniques.
      • Tests the total contribution of each spline term based on the Wald statistic.
      • Provides model-building syntax that can include classification variables, continuous variables, interactions and nestings.
      • Enables you to construct a spline term by using multiple variables.
    • Proportional hazard regression:
      • Fit the Cox proportional hazards regression model to survival data and perform variable selection.
      • Provides model-building syntax with classification variables, continuous variables, interactions and nestings.
      • Provides effect-construction syntax for polynomial and spline effects.
      • Performs maximum partial likelihood estimation, stratified analysis and variable selection.
      • Partitions data into training, validation and testing roles.
      • Provides weighted analysis and grouped analysis.
    • Statistical process control: 
      • Perform Shewhart control chart analysis.
      • Analyze multiple process variables to identify processes that are out of statistical control. 
      • Adjust control limits to compensate for unequal subgroup sizes.
      • Estimate control limits from the data, compute control limits from specified values for population parameters (known standards) or read limits from an input data table.
      • Perform tests for special causes based on runs patterns (Western Electric rules).
      • Estimate the process standard deviation using various methods (variable charts only).
      • Save chart statistics and control limits in output data tables.
    • Independent component analysis:
      • Extracts independent components (factors) from multivariate data.
      • Maximizes non-Gaussianity of the estimated components.
      • Supports whitening and dimension reduction.
      • Produces an output data table that contains independent components and whitened variables.
      • Implements symmetric decorrelation, which calculates all the independent components simultaneously.
      • Implements deflationary decorrelation, which extracts the independent components successively.
    • Linear mixed models:
      • Supports many covariance structures, including variance components, compound symmetry, unstructured, AR(1), Toeplitz, factor analytic, etc.
      • Provides specialized dense and sparse matrix algorithms.
      • Supports REML and ML estimation methods, which are implemented with a variety of optimization algorithms.
      • Provides Inference features, including standard errors and t tests for fixed and random effects.
      • Supports repeated measures data.
    • Model-based clustering:
      • Models the observations by using a mixture of multivariate Gaussian distributions.
      • Allows for a noise component and automatic model selection.
      • Provides posterior scoring and graphical interpretation of results.

    Descriptive statistics

    • Distinct counts to understand cardinality.
    • Box plots to evaluate centrality and spread, including outliers for one or more variables.
    • Correlations to measure the Pearson’s correlation coefficient for a set of variables. Supports grouped and weighted analysis.
    • Cross-tabulations, including support for weights.
    • Contingency tables, including measures of associations.
    • Histograms with options to control binning values, maximum value thresholds, outliers and more.
    • Multidimensional summaries in a single pass of the data.
    • Percentiles for one or more variables.
    • Summary statistics, such as number of observations, number of missing values, sum of nonmissing values, mean, standard deviation, standard errors, corrected and uncorrected sums of squares, min and max, and the coefficient of variation.
    • Kernel density estimates using normal, tri-cube and quadratic kernel functions.
    • Constructs one-way to n-way frequency and cross-tabulation tables.

    Group-by processing

    • Build models, compute and process results on the fly for each group or segment without having to sort or index the data each time.
    • Build segment-based models instantly (i.e., stratified modeling) from a decision tree or clustering analysis.

    Model comparison, assessment & scoring

    • Generate model comparison summaries, such as lift charts, ROC charts, concordance statistics and misclassification tables for one or more models.
    • Interactively slide the prediction cutoff for automatic updating of assessment statistics and classification tables.
    • Interactively evaluate lift at different percentiles.
    • Export models as SAS DATA step code to integrate models with other applications. Score code is automatically concatenated if a model uses derived outputs from other models (leaf ID, cluster ID, etc.).

    Model scoring

    • Export models as SAS DATA step code to integrate models with other applications. Score code is automatically concatenated if a model uses derived outputs from other models (leaf ID, cluster ID, etc.).

    SAS® Viya® in-memory runtime engine

    • SAS Cloud Analytic Services (CAS) performs processing in memory and distributes processing across nodes in a cluster.
    • User requests (expressed in a procedural language) are translated into actions with necessary parameters to process in a distributed environment. The result set and messages are passed back to the procedure for further action by the user.
    • Data is managed in blocks and can be loaded in memory on demand. If tables exceed the memory capacity, the server caches the blocks on disk. Data and intermediate results are held in memory as long as required, across jobs and user boundaries.
    • An algorithm determines the optimal number of nodes for a given job.
    • A communication layer supports fault tolerance and lets you remove or add nodes from a server while it is running. All components in the architecture can be replicated for high availability. 
    • Products can be deployed in multitenant mode, allowing for a shared software stack to support securely isolated tenants.

    Deployment options

    • On-site deployments:
      • Single-machine mode to support the needs of small to midsize organizations.
      • Distributed mode to meet growing data, workload and scalability requirements.
    • Cloud deployments:
      • Enterprise hosting.
      • Private or public cloud (e.g., BYOL in Amazon) infrastructure.
      • Cloud Foundry platform as a service (PaaS) to support multiple cloud providers. 

    Back to Top