데이터 시각화
데이터 시각화의 정의 및 중요성
데이터 시각화란 데이터를 그림이나 그래픽 형식으로 표현하는 것입니다. 의사 결정권자는 시각적으로 표현된 분석(analytics)정보를 바탕으로 개념을 이해하거나 새로운 패턴을 식별할 수 있습니다. 대화형 시각화 기술을 이용하면 차트와 그래프를 만들어 보다 상세히 검토하여 개념을 심층적으로 이해하고, 검토 중인 데이터와 데이터의 처리 방식을 대화식으로 변경할 수 있습니다.
데이터 시각화의 역사
그림을 사용하여 데이터를 이해한다는 개념은 수 세기 전으로 거슬러 올라갑니다. 17세기에는 지도와 그래프가, 1800년대 초에는 파이 도표가 발명되었습니다. 수십 년 후 샤를 미나르(Charles Minard)가 나폴레옹의 러시아 침공을 지도로 만들었는데, 지금도 대표적인 통계 그래프 중 하나로 인용되고 있습니다. 이 지도에는 침략 당시 군대의 규모와 나폴레옹이 모스크바에서 퇴각한 경로가 묘사되어 있는데, 사건을 보다 상세히 기술하기 위해 당시의 기온과 침략 기간도 함께 서술되어 있습니다
그러나 데이터 시각화에 불을 지핀 것은 다름 아닌 기술이었습니다. 컴퓨터가 등장하자 많은 양의 데이터를 매우 빠른 속도로 처리할 수 있게 되었습니다. 오늘날 데이터 시각화는 과학과 예술의 조합으로 빠르게 진화하고 있으며, 향후 몇 년간 기업 환경을 분명 변화시킬 것입니다.
데이터 시각화: 빅 데이터의 미래를 준비하는 현명한 투자
빅-데이터(big data) 에는 엄청난 기회가 잠재되어 있지만 다수의 소액 거래 은행들이 빅데이터에 대한 투자 효과를 거두는 데 어려움을 겪고 있습니다. 빅데이터를 이용해 고객 관계를 어떻게 개선할 수 있을까요? 또 빅데이터에 어떻게, 얼마나 투자해야 최상의 투자 효과를 거둘 수 있을까요?
영국의 한 대형 은행의 고객 가치 모델링 책임자인 사이먼 사무엘(Simon Samuel)과의 인터뷰를 통해 소액 거래 은행들이 직면한 여러 가지 빅데이터 문제를 살펴봅니다.
데이터 시각화는 왜 중요할까요?
인간의 두뇌가 정보를 처리하는 방식을 고려해보면, 스프레드시트나 보고서를 꼼꼼히 살펴보는 것보다 도표나 그래프를 이용해 대량의 복잡한 데이터를 시각화하는 것이 훨씬 쉽습니다. 데이터 시각화는 보편적인 방식으로 개념을 쉽고 빠르게 전달할 수 있는 방법입니다. 게다가 약간의 수정을 더하면 다양한 시나리오를 시험해볼 수 있습니다.
이 외에도 다음과 같은 이점이 있습니다
- 주의를 요하거나 개선이 필요한 영역을 파악할 수 있습니다..
- 고객 행동에 영향을 미치는 요소를 규명할 수 있습니다.
- 어떤 제품을 어디에 배치해야 하는지 이해할 수 있습니다.
- 판매량을 예측할 수 있습니다.
데이터 시각화 업계 이용 현황
데이터 시각화는 비즈니스 환경에 어떤 영향을 미쳤으며 또 앞으로 어떤 영향을 미치게 될까요? 전문가들은 이렇게 이야기합니다.
데이터 시각화 기술
그림 하나가 천 마디 말보다 나은 경우가 있습니다. 수천개 내지 수백만 개의 변수가 포함된 데이터를 이해하고 관계성을 찾아내려는 경우에는 특히 그렇습니다
이 백서에서는 데이터에서 유의미한 시각화 자료를 도출하는 데 유용한 몇 가지 기본 팁과 기술을 소개합니다.
데이터 시각화는 분석가가 데이터를 다루는 방식에 변화를 가져오고 있습니다. 덕분에 분석가가 문제에 보다 신속하게 대응할 수 있습니다. 또, 더 많은 분석 정보를 확보하려면 데이터를 다른 시각에서 보다 창의적으로 살펴볼 수 있어야 합니다. 데이터 시각화는 창의적인 데이터 탐색을 실현합니다. Simon Samuel 영국의 한 대형 은행의 고객 가치 모델링 책임자
데이터 시각화 기능은 어떻게 사용되고 있을까요?
산업의 유형이나 규모에 관계없이 모든 유형의 기업들이 데이터를 파악하는 데 데이터 시각화를 이용하고 있습니다. 방법은 다음과 같습니다.
정보를 빠르게 이해
그래픽으로 나타낸 비즈니스 정보를 이용하면 명확하고 일관적인 방식으로 많은 양의 데이터를 파악하여 결론을 도출할 수 있습니다. 또한 (스프레드시트 형식의 정보를 분석하는 것에 비해) 그래픽 형식의 정보는 분석이 훨씬 빠르기 때문에 문제를 적시에 해결할 수 있으며 질문에 대한 해답을 빠르게 도출할 수 있습니다.
관계성과 패턴의 파악
방대한 양의 복잡한 데이터라도 그래픽으로 표현하면 이해하기 쉬워집니다. 따라서 서로 관련성이 높은 파라미터를 인지할 수 있습니다. 상관 관계가 명확한 파라미터도 있지만 그렇지 않은 파라미터도 있습니다. 이러한 관계를 파악하면 가장 중요한 목표에 영향을 줄 수 있는 영역에 집중할 수 있습니다.
새로운 동향 파악
데이터 시각화를 이용해 비즈니스와 시장의 동향을 파악하면 경쟁 우위를 확보할 수 있으며 궁극적으로 수익을 높일 수 있습니다. 또한 제품의 품질이나 고객 이탈에 영향을 미치는 이상치를 쉽게 발견하고, 문제가 커지기 전에 사전에 해결할 수 있습니다.
정보 전달
시각적 분석을 통해 새로운 분석 정보가 발견되면 이를 관련 인원에게 공유해야 합니다. 이 단계에서는 도표나 그래프 또는 기타 시각적으로 효과적인 데이터 형식을 사용하는 것이 중요한데, 이는 시선을 집중시켜 메시지를 신속히 전달할 수 있기 때문입니다.
작동 원리
데이터 시각화의 실전 활용
데이터 시각화가 많은 양의 데이터를 이해하는 데 도움이 된다는 것은 쉽게 이해할 수 있겠지만 그 다음에 무엇을 해야 하는지는 이해하기 쉽지 않습니다. 어떤 유형의 기술이 필요하며, 그 기술을 어떻게 사용해야 할까요?
이 실용적인 동영상에서는 SAS Visual Analytics와 SAS Visual Statistics를 간략히 소개하고, 다양한 구성을 이용해 수십억 행의 데이터를 몇 초 만에 탐색할 수 있는 방법을 소개합니다. SAS 기술을 이용하면 웹, PDF 또는 모바일 기기를 통해 데이터를 준비하고, 보고서와 그래프를 작성하며, 새로운 분석 정보를 발견하고, 시각 정보를 다른 사람들과 공유할 수 있습니다.
데이터 시각화의 확립
새로운 기술을 구현하려면 먼저 거쳐야 할 몇 가지 단계들이 있습니다. 데이터를 확실하게 이해해야 할 뿐만 아니라 목표와 요구사항, 정보 전달 대상도 이해해야 합니다. 데이터 시각화 기술을 구현하려면 먼저 다음을 수행해야 합니다.
- 시각화하려는 데이터가 무엇인지, 그리고 그 크기와 기수성(열에 있는 데이터 값의 고유성)을 이해해야 합니다.
- 시각화하려는 데이터와 전달하려는 정보의 유형을 결정해야 합니다.
- 정보를 누구에게 전달할 것인지, 또 이들이 시각적 정보를 어떻게 처리하는지를 이해해야 합니다.
- 정보 전달 대상에게 가장 단순한 형태로 정보를 명확하게 전달할 수 있는 시각적 형식을 사용해야 합니다.
보유한 데이터의 유형을 비롯해, 정보를 소비할 대상이 파악되면 이제 처리할 데이터의 양에 대비해야 합니다. 빅데이터를 처리하려면 많은 양, 다양한 종류, 다양한 속도를 고려해야 하기 때문에 빅데이터는 시각화에 새로운 해결 과제를 야기합니다. 또한 데이터를 관리하고 분석하는 속도보다 데이터가 생성되는 속도가 더 빠른 경우도 많습니다.
또 고려해야 할 요인들이 몇 가지 있는데, 이를테면 시각화하려는 열의 기수성을 들 수 있습니다. 기수성이 높다는 것은 고유값의 비중이 높다는 것을 의미합니다(예: 모든 항목이 고유성을 가져야 하는 은행 계좌번호). 기수성이 낮다는 것은 데이터 열에서 반복값의 비중이 높다는 것을 의미합니다(예: '성별' 열).
최적의 시각적 분석 방식 결정하기
비즈니스 사용자가 해결해야 할 최대 난제 중 하나는 정보를 가장 효과적으로 나타낼 수 있는 시각적 형식을 결정하는 것입니다. SAS Visual Analytics는 지능형 자동 도표 기능을 이용해 선택된 데이터 를 바탕으로 최적의 시각적 분석 자료를 생성합니다.
이 자동 도표 기능은 새 데이터 세트를 처음 탐색할 때 특히 유용한데,이는 많은 양의 데이터를 빠르게 살펴볼 수 있기 때문입니다. 이 데이터 탐색 기능은 숙련된 통계 전문가에게도 유용합니다. 반복 샘플링을 실시하지 않고도 각 모델에 적합한 데이터를 판별하여 분석 수명 주기 프로세스의 속도를 단축할 수 있기 때문입니다.
이 주제에 관한 더 많은 글 읽기
- Are you good at scoring?Credit scoring is the foundation for evaluating clients who apply for a loan (or other types of exposure for the bank). It is not unusual for it to take up to 12 months to build and deploy a new credit scoring model. Reforming the process will help minimize losses, increase earnings and reduce operational risk.
- Optimizing well placement to eliminate water poverty How data visualization is helping Water for Good bring fresh water to the Central African Republic.
- The transformational power of evidence-based decision making in health policyState health agencies are under pressure to deliver better health outcomes while minimizing costs. Read how data and analytics are being used to confront our biggest health care challenges head on.
- Location intelligence: Adding geospatial context to BI Get tips for implementing a location intelligence data strategy from industry thought leader and data explorer, Jen Underwood.