SAS® Programming 3 : 고급 기술 및 효율성
SAS® Programming 3 : 고급 기술 및 효율성
교육 기간 : 3일(18시간)
교육 대상
이 과정은 프로그래밍 기술을 향상시키고 특정 작업을 수행함에 있어 가장 효율적인 몇 가지 기술들을 알고자 하는 경험이 많은 SAS 프로그래머를 대상으로 합니다.
과정 소개
이 과정은 SAS® Programming II 과정에서 나타난 개념들에 기반합니다. Direct access를 이용한 데이터 읽기, 데이터 결합, 다차원 배열 사용, 해쉬 테이블, 테이블 룩업 용도의 포맷/ 효과적인 데이터 저장 / Best Practice 활용 등에 초점이 맞추어져 있습니다. 추가로 이 과정은 self-study 섹션이 제공되어 SAS® Scalable Performance Data Engine로 테이블을 생성하고 사용하는 것이 소개되어 있습니다.
선수 지식
이 과정은 SAS를 시작하는 분에게는 적당하지 않습니다.
이 과정 참석 전에, 참석자는 적어도 9개월 이상의 SAS 프로그래밍 경험이 있어야 하며 SAS® Programming II를 이수해야 합니다.
특히, 다음이 가능해야 합니다.
- 사용자 OS의 파일 구조와 기본 OS 작업 수행에 대한 이해.
- 프로그래밍 로직 개념의 이해.
- DATA step의 컴파일과 실행 단계의 이해.
- 여러 가지 종류의 입력으로 외부파일을 읽어 SAS 데이터 셋 생성.
- SAS 데이터 라이브러리에 접근.
- SAS 날짜값 생성 및 사용.
- SAS 데이터 셋 읽기, 수직/수평 결합.
- DROP=, KEEP=, RENAME= 데이터 셋 옵션의 사용.
- 여러 개의 출력 데이터 셋 생성.
- 배열 처리와 DO 루프 이용하여 데이터 반복 처리.
- SAS 함수 이용하여 데이터 조작 및 변환 수행.
교육 내용
소개 | - 효율성 측정 - SAS 프로세싱 - 메모리와 I/O 리소스 컨트롤 |
관측치 억세스 | - 샘플 데이터 셋 생성 - 인덱스 생성 및 사용 |
데이터 수평 결합 | - 값으로 데이터 셋 결합 - 요약 및 상세 데이터 결합 - 인덱스 사용하여 데이터 결합 - 데이터 갱신 - 두 번의 SET 분장으로 요약 및 상세 데이터 결합 (self-study) |
데이터 수직 결합 | - SAS data sets 결합 - raw data files 결합 |
BY그룹 처리와 정렬 | - 중복 제거 - 리소스 정렬 - 우측 정렬 루틴 선택 (self-study) - 정렬의 대안 |
Lookup 테이블 이용하여 데이터 매칭 | - Lookup 테이블로 배열 사용 - Lookup 테이블로 hash object 사용 - Lookup 테이블로 포맷 사용 - Lookup 테이블로 데이터 전치 |
데이터 저장 공간 컨트롤 | - 숫자 변수의 길이 줄이기 - 데이터 파일 압축 - DATA step view 생성 |
효율성 향상을 위한 Best Practices 활용 | - 필요한 문장만 실행 - 데이터에서 불필요한 pass를 제거 - 필요한 데이터만 읽고 쓰기 - 네트웍 효율성 고려(self-study) |
Scalable Performance Data Engine 사용(Self-Study) | - SPD engine 테이블 생성 - SPD engine 효과적 사용 - SPD Engine LIBNAME 문장의 옵션 |
추가적인 Topics (Self-Study) | - modifying SAS data sets in place - creating generation data sets - creating integrity constraints - creating and using audit trails - working with Perl regular expressions |
사용 소프트웨어
Base SAS®
교육 교재
SAS® Programming 3 : Advanced Techniques and Efficiencies