SAS BOOK

SAS Text Miner를 활용한 텍스트 마이닝 방법론

 

저자:강현철
페이지 수:162
가격:₩ 15,000
출판일:2020-07-10
출판사:자유아카데미
ISBN:9791158082666(93310)

머리말

오늘날 텍스트 마이닝은 빅데이터 분석 또는 데이터 과학의 대표적인 한 분야로 자리매김하였으며, 데이터마이닝 및 머신러닝 등 데이터 처리 기술을 활용하여 언어에 담긴 정보를 정형적 데이터로 추출해냄으로써 여러 학문분야에 기여하고 있다. 또한 텍스트 마이닝은 언어학, 전산학, 통계학 등이 모두 상당한 수준으로 관여하는 대표적인 다학제(multi-disciplinary) 연구분야이다. 이 책은 여러 분야의 독자들에게 통계분석 측면에서 텍스트 마이닝 방법론을 소개하는 데 초점을 두고 있다. 특히 SAS Text Miner를 활용하여 텍스트 분석을 수행하는 다양한 사례들을 다루고 있다.

이 책은 총 10개의 장으로 구성되어 있다. 먼저 1장에서는 텍스트 마이닝의 기본 개념을 간단히 소개하였고, 2장에서는 SAS Text Miner 주요 기능과 사용법을 실제 사례를 통해 설명하였다. 3장과 4장에서는 파싱(parsing)과 필터링(filtering)을 통해 텍스트를 추출하고 가공하는 방법을 다루었다. 5장과 6장에서는 클러스터링(clustering)과 토픽분석(topic analysis)을 통해 텍스트로부터 유용한 정보를 추출하는 내용을 설명하였다. 7장과 8장에서는 범주형 목표변수를 설명하고 예측하는 데 사용될 수 있는 두 가지 방법론을 소개하였고, 9장에서는 텍스트 정보를 이용하여 예측모형을 구축하는 사례를 다루었다. 그리고 10장에서는 디렉터리(directory) 또는 웹(web)으로부터 텍스트를 추출하는 사례를 제시하였다.

이 책에서는 실제 사례에 대하여 SAS Text Miner의 처리 과정과 주요 결과들을 현실감 있게 설명하고 있다. 따라서 각 장에 제시된 사례들의 분석과정을 직접 수행하여 봄으로써 관련된 내용을 보다 재미있게 학습할 수 있을 것이다. 이를 위해 각 사례에 사용된 데이터들을 ‘자유아카데미’의 홈페이지를 통해서 제공하고 있다(http://www.freeaca.com). 또한 이 책을 가지고 강의하시는 분들을 위해 별도로 강의자료를 제공하고 있다 (자유아카데미에 문의 바람). 이 책이 실제 문제에서 텍스트 마이닝을 수행하고자 하는 다양한 분야의 연구자들에게 유용하게 사용되기를 바란다.

목차


제1장 서론
제2장 SAS Text Miner 맛보기
제3장 텍스트 파싱
제4장 텍스트 필터링
제5장 텍스트 클러스터링
제6장 텍스트 토픽 분석
제7장 텍스트 프로파일링
제8장 텍스트 규칙 빌더
제9장 예측모형 구축 사례
제10장 텍스트 가져오기
찾아보기