SAS BOOK

4차 산업혁명 나 혼자 배우는 SAS Programming

 

저자:이기석
페이지 수:276
가격:₩19,000
출판일:2018-12-28
출판사:박영사
ISBN:979-11-303-0740-4

머리말

SAS를 처음 접하는 초보자를 위해 SAS University Edition을 무료로 다운로드 받는 방법과, SAS 프로그램을 작성하고, 실행하고, 결과를 얻는 기초적인 방법들 을 부록 Ⅰ에 담았다.
SAS Program은 데이터의 과학적 분석을 목표로 만들어진 컴퓨터 소프트웨어 (Software)이며 특히 기업들을 주요 고객으로 삼아 제작된 소프트웨어이다. 우리 나라 대부분의 대기업들뿐만 아니라 중견기업, 소기업들도 마케팅, 고객관리, 기 업회계, 인력관리, 재고관리, 미래예측 등에 사용하고 있다.
 
다른 프로그램과 비교하여 SAS가 비교우위에 있다고 생각되는 것은 위에서 언 급한 기업경영과 관련된 여러 가지 중요한 업무들을 손쉽게 할 수 있도록 각 업 무마다 필요한 프로그램을 모듈(Program Module)로 만들어 놓았다는 것이다. 많 은 수의 모듈들이 있기 때문에 기업마다 특수한 경영환경, 업무환경에 맞는 맞춤 형 모듈을 사용할 수 있다고 할 수 있다. 그러므로 배워두면 기업이나 연구소 등 에서 활용할 수 있는 살아있는 지식이 될 것 같아 집필하게 되었다.
 
저자가 1989년부터 거의 30년에 가까운 세월 동안 계량경제학을 강의하면서 SAS Program을 활용한 경험과, 학생들의 기대, 반응 등을 반영하여 집필하였다. 본 저서를 집필하게 된 가장 큰 동기는 여러 제자들의 반복된 질문이었다. “졸업 하고도 SAS Programming을 계속 배울 수 있어요?”이었다. 이 질문에 대한 저 자의 대답은 항상 “No!”였다. 왜냐하면, 계량경제학 이론을 배우면서 배운 이론 을 데이터에 바로 적용하는 데 필요한 컴퓨터 프로그래밍도 함께 가르치는 학교 나 학원은 거의 없다고 생각되었기 때문이다. 저자의 생각이 틀렸기를 바라지만, 대부분의 계량경제학이나 통계학 교수들이 이론뿐만 아니라 컴퓨터 프로그래밍 도 같이 가르치면서 학생들의 이론에 대한 이해도를 향상시키고자 노력하는 것 이 결코 쉽지 않다고 생각한다. 여기에는 이유가 있다. 왜냐하면, 프로그래밍 강의를 하고자 하면 바로 마주쳐야 하는 필수 임무가 학생들의 오타를 찾아주는 것 이다. 어떤 사람도 대단한 것이라고 여기지 않는 것이다. 거의 모든 교수들은 수 학으로 이론을 멋지게 증명하거나, 어려운 이론을 쉽게 설명하는 자신의 능력에 큰 보람과 자부심을 느끼지만, 학생들이 타이핑하다 실수한 것을 눈을 크게 뜨고 프로그램 텍스트 한 자, 한 자를 살펴서 오타를 찾아 내고 수정해 주는 것에서 큰 보람을 느끼지는 않는다. 이런 이유 때문에도 교수들이 직접 컴퓨터 프로그래 밍을 강의하지 않는 경우도 많다고 생각된다. 결국 컴퓨터 소프트웨어를 배우는 것은 전적으로 학생들의 몫이 되고 마는 경우가 대부분이다.
컴퓨터 랭귀지(Language)도 랭귀지다. 내 종(Servant)이면서, 미친듯이 빠른 속 도로 계산할 줄 아는 컴퓨터에게 일을 시키기 위해서는 내 종이 알아듣는 언어, 즉 컴퓨터 랭귀지를 배워야 한다. 랭귀지이기 때문에 어릴 때 배울수록 잘 배우 고 오래 남는다. 랭귀지는 한 달 밤샘해서 “도사”가 될 수 없다. 프로그래밍 전 문가가 되기 위해서는 외국어를 배우듯이 끈기와 열정이 있어야 한다. 한 가지 좋은 점은 컴퓨터 프로그래밍을 배우는 과정이 “재미도 쏠쏠하다”는 것이다. 기 쁨과 성취감을 느끼게 해주기 때문이다. 저자가 평생 잊지 못하는 일화가 있다. PASCAL이라는 오래된 컴퓨터언어를 미국에서 수강할 때였다. 숙제가 컴퓨터로 원(circle)을 그리는 것이었다. 별로 힘들지 않게 해 낼 수 있다고 생각했다. 그런 데 1주일 내내 그 숙제에만 매달렸는 데도 원은 그려지지 않았다. 수십 번 “포기 하자”를 반복하다 마침내 프린터가 원을 그리기 시작했을 때, 내 몸은 붕~ 떠서 하늘을 나는 것 같은 무중력의 짜릿함을 느꼈고, “드디어 내가 해내고야 말았 다!”라는 “성취감” “자존감”은 30여 년이 지난 지금도 생생한 기억으로 내 뇌리 에 각인되어 있다. 컴퓨터 언어를 배우는 데 좋은 점이 또 있다. 컴퓨터 언어들 은 서로 많이 닮았다. 그래서 한 언어를 잘 배워 놓으면, 다른 언어도 쉽게 배울 수 있다. 정말 다행이다. 독일어를 잘 하면 중국어도 쉽게 잘 할 수 있었으면 좋 겠지만 그건 아닌 것 같다.
 
컴퓨터 소프트웨어를 배우는 것은 소프트웨어 학습만으로 끝나는 것이 아니 다. 그 소프트웨어가 만들어 내는 결과물(Outputs)들이 어떻게 계산되고 어떻게 만들어졌는지를 알아야 진정한 소프트웨어 전문가가 될 수 있다. 그렇기 때문에 이 책에는 각각의 주제와 관련된 계량경제학, 통계학 기초이론에 대한 설명도 포함시켰다. 혼자 배우기 쉽게 하기 위해서 SAS Program 한 줄 한 줄마다 SAS가 무엇을 하라고 하는 명령인지에 대해 자세하고 꼼꼼하게 설명하였고, 그에 관련 된 이론들도 이해하기 쉽게 설명하였다. SAS의 명령 실행 결과는 다른 소프트웨어들보다 훨씬 풍부하다고 생각한다. 오랜 세월동안 진화를 거듭하며 다양하고 수많은 개인과 기업 수요자들의 니즈 (needs)를 충족하다 보니 대부분의 사용자가 필요로 하고 기대하는 결과값들 (Outputs)보다 더 다양하게 많이 나오니 푸짐해서 좋다. 사실 이것보다 더 중요 한 것은 많은 사람, 많은 기업들의 임원이나 CEO들이 최소한 “들어 본” 소프트 웨어고, “그거 잘하는 사람 있으면 소개 좀 해줘요”라고 부탁하는 소프트웨어라 는 것이다. 그래서 배울 가치가 있다. 4차 산업혁명 시대에 SAS를 배워서 자신의 역량과 가치를 높이고자 하는 학생, 취업준비 청년, 취업한 청년, 일반인들 누구 나 SAS University Edition을 무료로 다운로드 받아 BASE SAS, SAS/STAT, SAS/IML 등을 이용할 수 있다. 다운로드 받는 방법은 부록 I을 참고하기 바란다.
 
우리나라 정부도 컴퓨터 소프트웨어 인재 기르기에 발 벗고 나섰다고 한다. 어느 일간지에 난 최근 기사다. “… 내년, 2019년부터 5년간 5756억 원을 투입해 SW 핵심인재 1만 명을 양성하기로 했다. 26일(2018년 12월 26일) 과학기술정보 통신부는 이 같은 내용의 ‘4차 산업혁명 선도인재 집중양성 계획’을 발표했다. 2022년까지 증강현실?가상현실, 인공지능(AI), 빅데이터, 클라우드 등 4차 산업 혁명 관련 분야 인력이 3만여 명 부족할 것으로 예상되는 데 따른 조치다. 과기정 통부는 4차 산업혁명 분야 인력의 수요?공급의 불균형을 해소하고자 내년 9월을 목표로 비(非)학위 2년 과정의 ‘이노베이션 아카데미’를 설립하고 5년간 2500명의 SW 인재를 양성하기로 했다. 아울러 미래형 자동차, 무인비행기(드론) 분야의 국 내 석?박사급 인재(5년간 2250명)를 해외 유명 대학 및 연구소, 기업 등에 파견 하고 현지 전문가들과 공동 프로젝트를 통해 글로벌 경쟁력을 갖출 수 있도록 지 원한다.”
 
이 책으로 SAS Programming을 배우고자 하는 여러분들도 정부가 찾고, 대한 민국이 찾는 소중한 컴퓨터 소프트웨어 인재가 되길 진심으로 바란다.

 

목차

Chapter 01. 단순회귀모형을 활용한 데이터 분석

1.1     도출과 의미, 잠재적 문제점 6

1.2 SAS의 PROC REG으로 얻을 수 있는 결과값들 9

1.3 단순회귀모형을 이용한 가상 데이터 분석 17

SAS Program 1_1; 단순회귀모형으로 가상데이터 분석 17

SAS Program 1_1 설명 18

SAS Program 1_1 결과 설명(200개 샘플) 23

1.4 샘플 수가 증가하였을 때 회귀분석 결과의 변화 27

SAS Program 1_2 28

SAS Program 1_2: PROC REG 결과 일부(500개 샘플) 28

1.5 지연 효과 회귀모형(Lagged Effects Regression Model) 30

SAS Program 1_3 32

SAS Program 1_3 설명 33

SAS Program 1_3 결과 설명 39

 

Chapter 02. 구조변화 회귀모형(Structural Change Regression Model)

SAS Program 2_1 52

SAS Program 2_1 설명 53

2.1   검정(  test) 55

SAS Program 2_1 결과 설명 57

 

Chapter 03. 비대칭 회귀모형(Asymmetric Regression Model)

SAS Program 3_1 68

SAS Program 3_1 설명 69

SAS Program 3_1 결과 설명 70

 

Chapter 04. 샘플데이터의 다중공선성(Multicollinearity)

SAS Program 4_1 82

SAS Program 4_1 설명 83

SAS Program 4_1 결과 설명 83

 

Chapter 05. 회귀모형 오차항의 자기상관 검정

5.1 더빈–왓슨(Durbin–Watson) 검정 93

SAS Program 5_1 95

SAS Program 5_1 설명 96

SAS Program 5_1 결과 설명 96

5.2 더빈의   검정 98

SAS Program 5_2 100

SAS Program 5_2 설명 101

SAS Program 5_2 결과 설명 102

 

Chapter 06. 회귀모형 설정 오류

6.1 설명변수 누락 106

6.2 설명변수 추가 107

6.3 누락된 설명변수와 오차항의 자기상관 108

SAS Program 6_1 109

SAS Program 6_1 설명 110

SAS Program 6_1 결과 설명 110

 

Chapter 07 ∙ 최우추정법(Maximum Likelihood Estimation 

7.1 최우추정법의 장점 117

7.2 최우추정법을 사용하는 회귀모형 119

7.3 최우추정법을 사용하여 계수를 추정하는 SAS 프로그램 121

SAS Program 7_1 121

SAS Program 7_1 설명 122

SAS Program 7_1 결과 설명 124

7.4 오차항에 자기상관이 있는 다중회귀모형의 최우추정과 가설검정 128

SAS Program 7_2 128

SAS Program 7_2 설명 130

7.5 3개의 카이자승 검정통계식 132

SAS Program 7_2 결과 설명 133

7.6 설명변수의 비선형성 검정 138

SAS Program 7_3 140

SAS Program 7_3 설명 141

SAS Program 7_3 결과 설명 142

 

Chapter 08 ∙ 조건부이분산: 불확실성 측정 및 활용

8.1 조건부이분산 모형의 장점 152

8.2 조건부이분산 회귀모형 153

8.3 조건부이분산 검정 154

SAS Program 8_1 156

SAS Program 8_1 설명 157

SAS Program 8_1 결과 설명 158

SAS Program 8_2 163

SAS Program 8_2 설명 164

SAS Program 8_2 결과 설명 166

 

Chapter 09 ∙ 시계열분석과 미래 예측

9.1 AutoRgressive(AR) 모형 178

SAS Program 9_1 179

SAS Program 9_1 설명 179

SAS Program 9_1 결과 설명 180

9.2 AR(1) 모형의 미래 예측 방법 182

9.3 AR(1) 모형의 자기상관함수 ACF 184

9.4 부분자기상관함수(PACF)를 사용한 AR 오더 결정 방법 187

SAS Program 9_2: AR(1) 계수추정 188

SAS Program 9_2 설명 189

SAS Program 9_2 결과 설명 189

9.5 상수항이 있는 AR(1) 모형 200

9.6 AR(2) 모형 202

SAS Program 9_3: AR(2) 데이터 생성, 모형추정, 및 예측 202

SAS Program 9_3 설명 및 결과 설명 203

9.7 Moving Average(MA) 모형 209

9.8 MA 모형을 이용한 미래예측 213

SAS Program 9_4: MA(1) 데이터 생성 및 모형추정, 미래예측 214

SAS Program 9_4 설명 215

SAS Program 9_4 결과 설명 216

9.9 MA(2) 모형 221

9.10 ARMA(1,1) 모형 223

SAS Program 9_5: ARMA(1,1) 모형을 이용한

데이터 생성 및 모형 추정, 예측 223

SAS Program 9_5 설명 224

SAS Program 9_5 결과 설명 225

9.11 실제 ipg 데이터의 시계열 모형 찾기 및 미래 예측 231

SAS Program 9_6: 실제 데이터 ipg 시계열 분석 1 232

SAS Program 9_6 설명 232

SAS Program 9_6 결과 설명 233

SAS Program 9_7: 실제 데이터 ipg 시계열 분석 2 235

SAS Program 9_7 설명 235

SAS Program 9_7 결과 설명 236

 

Chapter 10 ∙ 불안정 시계열모형 검정(Testing of Nonstationary Time)

SAS Program 10_1: 불안정시계열 검정 251

SAS Program 10_1 설명 251

SAS Program 10_1 결과 설명 252

 

부록 Ⅰ SAS University Edition 무료 다운로드 262

부록 Ⅱ 외부자료 다운로드 받는 방법 264

부록 Ⅲ Dickey–Fuller Table 268

•  찾아보기(국문) 269

• 찾아보기(영문) 271