SAS BOOK

빅데이터 분석을 위한 SAS Enterprise Miner 기능과 사용법

 

저자:강현철, 김은석, 이성건, 이슬지, 채윤석, 최병정, 최종후, 한상태
페이지 수:300
가격:₩25,000
출판일:2014-08-10
출판사:자유아카데미
ISBN:9788973386703(93310)

머리말

디지털 경제의 확산으로 우리 주변에는 규모를 가늠할 수 없을 정도로 많은 정보와 데이터가 생산되는 빅데이터 환경이 도래하고 있다. 즉, PC와 인터넷, 모바일 기기 이용이 생활화되면서 사람들이 도처에 남긴 발자국(데이터)은 기하급수적으로 증가하고 있다. 빅데이터는 데이터의 생성 양, 주기, 형식 등이 기존 데이터에 비해 너무 크기 때문에, 종래의 방법으로는 수집, 저장, 검색, 분석이 어려운 방대한 데이터를 말한다. 따라서 대용량의 데이터를 효과적으로 분석할 수 있는 방법론과 도구의 필요성이 요구되고 있다. 사용하기가 쉽고 강력한 기능들을 가진 데이터마이닝 소프트웨어들은 보다 편리한 환경에서 데이터마이닝 작업을 수행할 수 있도록 도움을 줄 수 있다. 저자들은 “빅데이터분석을 위한 - 데이터마이닝 방법론(강현철 등, 2014)”을 통해서 데이터마이닝의 다양한 방법론과 활용사례를 소개한 바 있으며, 이 책에서는 가장 널리 사용되는 소프트웨어 중 하나인 SAS Enterprise Miner(E-Miner)의 사용법을 소개하고 있다(이 책은 E-Miner Version 12.1을 기초로 하여 서술되었다). Enterprise Miner는 데이터의 추출(sampling), 탐색(exploration), 변형(modifying), 모형화(modeling), 모형의 평가(assessment)라는 데이터마이닝의 5단계(SEMMA)에 따라서 각각의 기능을 담당하는 다수의 노드(node)들로 이루어져 있으며, 사용자는 필요한 노드를 선택하여 다이어그램작업공간에 분석흐름도(process flow)를 작성함으로써 데이터마이닝의 전 과정을 쉽게 수행할 수 있다.

목차

제1장 기본 윈도우와 노드의 종류
1.1 기본 윈도우
1.2 E-Miner 노드의 종류와 기능
1.3 여러 노드의 공통적인 속성

제2장 데이터 추출
2.1 입력 데이터(Input Data) 노드
2.2 표본추출(Sample) 노드
2.3 데이터 분할(Data Partition) 노드

제3장 탐색과 변형 노드
3.1 변수 탐색
3.2 그래프 탐색(Graph Explore) 노드
3.3 멀티 플롯(MultiPlot) 노드
3.4 통계량 탐색(StatExplore) 노드
3.5 변수 선택(Variable Selection) 노드
3.6 클러스터링(Clustering) 노드
3.7 SOM/Kohonen 노드
3.8 결측값 처리(Impute) 노드
3.9 값 대체(Replacement) 노드
3.10 변수 변환(Transform Variables) 노드

제4장 회귀(Regression) 노드
4.1 속성 패널
4.2 결과 보기

제5장 의사결정트리(Decision Tree) 노드
5.1 속성 패널
5.2 결과 보기
5.3 대화식 수행

제6장 신경망(Neural Network) 노드
6.1 속성 패널
6.2 결과 보기

제7장 평가 및 스코어 노드
7.1 모델비교(Model Comparison) 노드
7.2 스코어(Score) 노드
7.3 세그먼트 프로파일링(Segment Profile) 노드

제8장 유틸리티 노드
8.1 컨트롤 포인트(Control Point) 노드
8.2 메타데이터(Metadata) 노드
8.3 SAS 코드(SAS Code) 노드
8.4 스코어 코드 내보내기(Score Code Export) 노드
8.5 그룹 시작/종료(Start/End Groups) 노드

찾아보기