NEWS
보도자료
특집기사
SAS Intelli-Zine
SASCOM 매거진
뉴스레터 신청
Business Analytics 환경을 위한 유연한 데이터 구조 (데이터)

아래의 그림은 많은 정보계 환경에서 흔히 볼 수 있었던 전형적인 EDW 아키텍처입니다. 물론 데이터 Query 위주의 정형/비정형 리포팅, OLAP 위주의 B.I. 환경을 위한 기반 데이터 구조로써는 손색이 없다고 볼 수 있지만, B.A.가 지향하는 빠르고 유연한 비즈니스 인사이트 획득의 측면에서는 데이터의 유연성의 측면이 추가로 고려되어야 합니다.

아래 그림은 비즈니스 예측을 위한 분석과정의 예를 데이터 측면에서 간략히 보여주고 있습니다. 비즈니스 예측하거나 최적화하기 위해서는 매우 실험적이고 비정형적이며 반복적인, 서로 연계된 분석 과정을 필요로 합니다.

데이터로부터 새로운 패턴과 인사이트를 발견하기 위해서는 상세 데이터에 자유롭게 접근하고, 과거 데이터와 현재 데이터를 비교하며, 주요 변수들간의 관계를 파악하는 등 매우 많은 데이터 작업을 필요로 하게 되는데, 이를 위해서는 정형화된 DW / Mart 뿐만 아니라 분석가가 자유롭게 사용할 수 있는 데이터 작업공간이 요구됩니다. 결론적으로 B.A. 환경을 지원하기 위해서는 기존의 읽기 위주의 DW / Mart 이외에 분석가가 유연하게 사용할 수 있는 Custom Data 저장소가 필수적으로 제공되어야 합니다.

분석 환경에 따라 이 Custom 저장소는 다양한 구조 및 데이터 형태로 존재하게 되는데, SAS 분석 환경의 경우 가장 일반적인 SAS Dataset의 형태로 존재하거나, 성능 향상을 위해 SAS의 대용량 분석엔진인 SPDS 데이터의 형태로 존재하는 경우, 혹은 이후에 설명될 Sandbox의 형태로 EDW를 위한 DBMS내에 존재하는 경우를 생각해 볼 수 있습니다.

BI Workspace

BI 트랜드 측면에서도 모델링된 데이터를 조회하기만 했던 전통적 환경에서 발전하는 방향성의 하나로 "BI Workspace"라는 개념이 등장하고 있습니다. BI Workspace란 "분석가가 고정된 데이터/분석 모델, 보안과 같은 IT환경의 제약을 벗어나 자유롭게 데이터를 탐색하고 가공하고 분석할 수 있는 환경”을 일컫습니다. BI Workspace 환경에서 분석가는 기존 DW / Mart의 데이터를 유연하게 가공하여 새로운 데이터를 만들어 낼 수 있을 뿐만 아니라, 새로운 비즈니스 요건에 대한 데이터가 DW / Mart에 미리 존재하지 않더라도 다양한 외부 환경에 존재하는 데이터들을 연계하여 새로운 주제에 대한 분석을 유연하게 수행하고 그 결과를 DB에 저장할 수 있습니다.

결과적으로, 분석과정에서 필요한 데이터 작업의 셀프서비스 개념을 통해, IT는 현업으로부터의 데이터 요청에 대한 부하를 덜 수 있으며, 현업이나 분석가는 쏟아지는 새로운 비즈니스 요건에 대해 훨씬 빠르고 능동적으로 대응할 수 있는 역량을 가지게 됩니다.

Analytic Sandbox

Database측면에서 볼 때, 분석을 위한 Custom Data 저장공간의 의미로 Analytic Sandbox라는 용어가 등장합니다. Analytic Sandbox는 "복잡한 비즈니스 질문에 대한 해답을 얻기 위한 목적으로 Advanced Analysis 작업을 수행하기 위한 DB내 데이터 저장소"라는 의미를 가지는데, DB적인 측면에서는 DW의 일부 영역을 별도로 분리하여 분석을 위한 유연한 저장 공간으로 활용하는 개념입니다.

집중적인 분석작업을 수행하는 분석가들은 Analytic Sandbox 영역에 DW관리자의 승인 없이도 자유로이 데이터를 생성하면서 데이터 탐색과 변환, 분석 작업등을 수행할 수 있게 됩니다. 물론 Analytic Sandbox은 제한된 공간을 활용하기 위한 데이터 저장 기간의 관리는 물론, 기존 EDW의 성능에 대한 영향을 최소화 하기 위한 모니터링 및 부하가 큰 작업에 대한 우선 순위를 조정 등의 성능 관리가 필요하게 됩니다.

사실 EDW에 대한 자유로운 접근을 제한하는 경우도 흔한 IT 환경에서, EDW에 쓰기 가능한 공간을 제공하고 자유로운 비정형 분석을 수행될 수 있도록 허용하는 것은 관리적 입장에서는 매우 부담스러운 일이 아닐 수 없습니다. 하지만, Sandbox 개념은 많은 비용을 들여 도입한 고성능 Database의 활용 범위를 넓히고, 적극적으로 비즈니스적 가치를 증대시킬 수 있다는 측면에서 충분히 고려할 만 하다고 생각됩니다. 실제로도 국내에서 Sandbox 개념의 EDW를 운영하고 있는 기업에서 다양한 업무에 데이터 분석을 적극적으로 활용하여 의사결정에 적용하는 문화가 매우 활성화되어 있음을 볼 수 있습니다.

고객지원
기술문의, 구입문의, 일반문의, 고객소리함
자료실
E-브로셔, White paper
데모 & 투어
뉴스레터
SAS Intelli-Zine
뉴스레터 신청
Events
이벤트와 세미나 정보
대표전화 : 02-2191-7000
교육문의 : 02-2191-7002
기술문의 : 02-2191-7003
Global Contact List