SAS® Visual Data Mining and Machine Learning

통합 협업 솔루션을 통해 단일 환경에서 가장 까다로운 분석 문제들을 해결합니다.



SAS Visual Data Mining 및 Machine Learning은 통합적인 시각화(프로그래밍) 인터페이스를 통하여 분석 라이프 사이클의 모든 작업을 처리하는 엔드 투 엔드(End-to-end)로 데이터 마이닝 및 머신러닝 프로세스를 지원합니다. 다양한 사용자에게 적합하며 애플리케이션을 전환 할 필요가 없습니다. 데이터 관리에서 모델 개발 및 배포에 이르기까지 모두작업을 동일한 통합 환경에서 진행할 수 있습니다.

 

 

 

 

복잡한 분석 문제를 보다 더 빠르게 해결할 수 있습니다.

SAS의 최신 플랫폼인 SAS® Viya®에서 실행되어 놀라운 속도로 예측 모델링과 머신러닝을 수행합니다. 메모리 내 데이터 지속성은 반복 분석 중에 데이터를 여러 번 로드 할 필요가 없습니다. 여러 사용자가 쉽게 협업할 수 있으므로 동시에 동일한 원시 데이터를 탐색하고 모델을 구축 할 수 있습니다. 따라서 시간 단위가 아닌 초 또는 분 단위로 분석 모델링을 신속히 처리할 수 있기에 아무리 복잡한 문제라도 빠르게 해결할 수 있습니다.

데스크톱 모니터에 Python ROC 도표를 표시하고 있는 Visual Data Mining and Machine Learning

 

 

다양한 프로그래밍 언어를 지원합니다.

SAS 코드를 알지 못해도 문제없습니다. Python, R, Java 및 Lua 프로그래머는 SAS 프로그래밍 방법을 배우지 않고도 다른 프로그래밍 언어를 통해 검증된 SAS 머신러닝 알고리즘에 액세스하여 강력한 성능을 경험할 수 있습니다. 또한 자동 생성된 SAS 스코어 코드를 사용하여 예측 모델을 신속하게 배포할 수 있습니다. 모든 머신러닝 모델에 손쉽게 구현할 수 있는 스코어 코드가 다양한 프로그래밍 언어로 자동 생성되므로 훨씬 더 많은 시간이 절약됩니다.

Viya Data Mining and Machine Learning에서 오토 튜닝 옵션과 유틸리티 창을 표시하고 있는 데스크톱 모니터의 스크린샷

 

 

다양한 접근법으로 빠르게 탐색하여 최적의 해답을 찾을 수 있습니다.

분산 처리를 통해 구현되는 탁월한 성능과 다양한 기능을 갖춘 머신러닝 파이프라인을 통해 다양한 데이터 분석접근 방법을 신속하게 탐색하고 비교할 수 있습니다. 또한 자동화된 모델 튜닝을 통해 통합 환경에서 빠르고 쉽게 여러 시나리오를 탐색하고 비교하여 최상의 모델을 찾을 수 있습니다. 비정형(Unstructured) 데이터와 정형(Structured) 데이터를 통합 머신러닝 프로그램에 결합하여 새로운 데이터 유형으로부터 더 가치 있는 인사이트를 얻을 수 있습니다. 또한 분석 라이프 사이클 각각의 단계의 재현성(Reproduceability)을 통해 신뢰할 수 있는 해답과 인사이트를 제공합니다.

 

 

분석 팀의 생산성을 극대화할 수 있습니다.

데이터 사이언티스트와 기타 분석 전문가들은 머신러닝 파이프라인을 지원하는 단일의 협업 환경으로부터 매우 정확한 결과를 얻을 수 있습니다. 이 솔루션을 통해 다양한 사용자는 데이터에 엑세스하여 준비하고, 탐색적 분석을 실행하며 머신러닝 모델을 구축 및 비교하고, 예측 모델을 적용하기 위한 스코어 코드도 생성할 수 있습니다. 이 모든 작업을 이전보다 훨씬 더 빠르게 할 수 있습니다.

데스크톱 모니터에 표시된 SAS Visual Data Mining and Machine Learning의 시각적 인터페이스

 

 

데이터와 의사결정 간 지연 시간이 줄어듭니다.

인터랙티브 시각화 및 프로그래밍 인터페이스를 통해 데이터를 준비하고 고급 머신러닝 모델을 구축하는 시간을 비약적으로 줄일 수 있습니다. 사용자는 데이터 소스와 코드 정보(Code snippets)를 공유하여 더욱 효과적으로 협업할 수 있으며 SAS 또는 Python, Java, Lua 같은 다른 프로그래밍 언어를 프로젝트 코딩에 사용할 수 있습니다. SAS 코드가 이후 배치(Batch) 실행, 편집 및 자동화 작업을 위해 자동으로 생성되며, 고급 머신러닝 알고리즘은 코드를 작성하지 않고도 드래그-앤-드롭(Drag-and-Drop) 방식의 시각화 인터페이스를 사용하여 생성할 수 있습니다.

주요 기능

  • 유연하고 편리한 접근 방식의 시각화 분석 환경. 여러 사용자가 현재 사용하기 쉬운 시각화 인터페이스를 통해 정형(Structured) 및 비정형(Unstructured) 데이터를 얼마든지 분석할 수 있습니다. 
  • 뛰어난 확장성을 가진 인-메모리 분석 프로세싱. 다양한 사용자가 안전하게 인-메모리 데이터에 동시에 액세스할 수 있는 환경을 제공합니다. 여러 노드에 병렬로 분산된 데이터 및 분석 워크로드 작업이 각 노드에 멀티스레드(multithreaded) 처리되어 매우 빠른 속도를 제공합니다.
  • 최신 통계, 데이터 마이닝 및 머신러닝 기법. 방대한 최신 통계, 머신러닝, 딥러닝 및 텍스트 분석 알고리즘을 단일 환경에서 액세스 할 수 있습니다. 클러스터링, 다양한 회귀분석, 랜덤 포레스트, 그래디언트 부스팅 모델, 서포트 벡터 머신(SVM), 자연어 처리(Natural Language Processing), 토픽 추출 등 다양한 분석 기능을 제공합니다. 
  • 통합 데이터 준비, 탐색 및 피처 엔지니어링(Feature Engineering; 특징추출). 데이터 엔지니어들은 드래그-앤-드롭(Drag-and-Drop) 인터페이스를 사용하여 비주얼 파이프 라인 활동(activities) 내에서 변환을 신속하게 작성 및 실행하고 데이터를 보강하며 데이터를 결합 할 수 있습니다. 모든 작업은 메모리 내에서 수행되므로 일관적인 데이터 구조를 유지할 수 있습니다.
  • 통합 텍스트 분석. 빅데이터를 고려한 설계 방식으로 대규모 텍스트 문서도 쉽게 검사할 수 있습니다. 데이터의 일부 뿐만 아니라 모든 텍스트 데이터를 검사하여 알려지지 않은 주제와 연관성에 대한 새로운 인사이트를 얻을 수 있습니다. 
  • 모델 평가 및 스코어링. 단 한 번의 실행으로 여러 가지 모델링 방식을 테스트하고 표준화된 테스트를 통해 다수의 지도 학습 알고리즘의 분석 결과를 비교하여 빠른 시간 내에 챔피언 모델을 판단할 수 있습니다. 그 이후, 자동 생성 된 SAS 스코어 코드를 사용하여 분산 환경 및 일반 환경에서 분석결과를 운영에 활용하실수 있습니다.
  • 액세스 가능한 클라우드 기반 솔루션. 모델러와 데이터 사이언티스트는 Python, R, Java, Lua 등 선호하는 코딩 환경을 통해 SAS 기능에 액세스할 수 있습니다. 또한 SAS Viya REST API를 사용하면 SAS의 기능을 다른 응용 프로그램에 추가할 수 있습니다.

데모

반응형 비주얼 인터페이스

SAS 분석을 파이썬에 활용하는 법

 

이 새로운 솔루션은 폭넓고 깊이 있게 모든 분석 과제를 해결할 수 있는 최첨단 오픈 아키텍처인 SAS Viya를 기반으로 실행됩니다. 단일 클라우드 환경인 SAS Viya는 확장 가능하고 안전할 뿐만 아니라 애자일 IT 환경에 없어서는 안 될 분석 관리 및 거버넌스를 통해 데이터 사이언티스트에서 비즈니스 분석가까지, 그리고 애플리케이션 개발자에서 기업 임원에 이르기까지 누구나 이용할 수 있습니다. 분석 분야를 선도하는 세계적 리더인 SAS와 함께 여러분이 기대해왔던 성능을 경험해보세요.

연관 자료


SAS Visual Data Mining and Machine Learning 에 대한 팩트 시트를 확인해 보십시오.


SAS는 The Forrester Wave: Predictive Analytics and Machine Learning Solutions, Q1 2017에서 리더로 선정되었습니다.


머신러닝에 대한 다섯 가지 오해를 확인해 보십시오.