SAS® Programming 3 : 고급 기술 및 효율성

SAS® Programming 3 : 고급 기술 및 효율성

교육 기간 : 3일(18시간)

교육 대상
이 과정은 프로그래밍 기술을 향상시키고 특정 작업을 수행함에 있어 가장 효율적인 몇 가지 기술들을 알고자 하는 경험이 많은 SAS 프로그래머를 대상으로 합니다.

과정 소개
이 과정은 SAS® Programming II 과정에서 나타난 개념들에 기반합니다. Direct access를 이용한 데이터 읽기, 데이터 결합, 다차원 배열 사용, 해쉬 테이블, 테이블 룩업 용도의 포맷/ 효과적인 데이터 저장 / Best Practice 활용 등에 초점이 맞추어져 있습니다. 추가로 이 과정은 self-study 섹션이 제공되어 SAS® Scalable Performance Data Engine로 테이블을 생성하고 사용하는 것이 소개되어 있습니다.

선수 지식
이 과정은 SAS를 시작하는 분에게는 적당하지 않습니다.
이 과정 참석 전에, 참석자는 적어도 9개월 이상의 SAS 프로그래밍 경험이 있어야 하며 SAS® Programming II를 이수해야 합니다.

특히, 다음이 가능해야 합니다.

  • 사용자 OS의 파일 구조와 기본 OS 작업 수행에 대한 이해.
  • 프로그래밍 로직 개념의 이해.
  • DATA step의 컴파일과 실행 단계의 이해.
  • 여러 가지 종류의 입력으로 외부파일을 읽어 SAS 데이터 셋 생성.
  • SAS 데이터 라이브러리에 접근.
  • SAS 날짜값 생성 및 사용.
  • SAS 데이터 셋 읽기, 수직/수평 결합.
  • DROP=, KEEP=, RENAME= 데이터 셋 옵션의 사용.
  • 여러 개의 출력 데이터 셋 생성.
  • 배열 처리와 DO 루프 이용하여 데이터 반복 처리.
  • SAS 함수 이용하여 데이터 조작 및 변환 수행.

교육 내용

소개- 효율성 측정
- SAS 프로세싱
- 메모리와 I/O 리소스 컨트롤
관측치 억세스- 샘플 데이터 셋 생성
- 인덱스 생성 및 사용
데이터 수평 결합- 값으로 데이터 셋 결합
- 요약 및 상세 데이터 결합
- 인덱스 사용하여 데이터 결합
- 데이터 갱신
- 두 번의 SET 분장으로 요약 및 상세 데이터 결합 (self-study)
데이터 수직 결합- SAS data sets 결합
- raw data files 결합
BY그룹 처리와 정렬- 중복 제거
- 리소스 정렬
- 우측 정렬 루틴 선택 (self-study)
- 정렬의 대안
Lookup 테이블 이용하여 데이터 매칭- Lookup 테이블로 배열 사용
- Lookup 테이블로 hash object 사용
- Lookup 테이블로 포맷 사용
- Lookup 테이블로 데이터 전치
데이터 저장 공간 컨트롤- 숫자 변수의 길이 줄이기
- 데이터 파일 압축
- DATA step view 생성
효율성 향상을 위한 Best Practices 활용- 필요한 문장만 실행
- 데이터에서 불필요한 pass를 제거
- 필요한 데이터만 읽고 쓰기
- 네트웍 효율성 고려(self-study)
Scalable Performance Data Engine 사용(Self-Study)- SPD engine 테이블 생성
- SPD engine 효과적 사용
- SPD Engine LIBNAME 문장의 옵션
추가적인 Topics (Self-Study)- modifying SAS data sets in place
- creating generation data sets
- creating integrity constraints
- creating and using audit trails
- working with Perl regular expressions

사용 소프트웨어
Base SAS®

교육 교재
SAS® Programming 3 : Advanced Techniques and Efficiencies