SASとHadoop入門   (1日間)

59,400円(本体価格 55,000円)/チケット捺印数:1

【注意】 本コースは、英語版テキストを使用し日本語で説明を行います。

受講対象

SASからHadoopへアクセスしたいSASプログラマー

前提知識

下記2コースを受講済みか、同程度の知識があることが求められます。

 「SAS®プログラミング1:必須要素
 「SAS® SQL:必須要素

学習内容

本コースでは、SASプログラミングを使用した、Hadoopデータの読み込み、書き込み、加工の方法をご紹介します。DATAステップによるローデータの読み込み、書き込み、HADOOPプロシジャを通した、SASからのMap-ReduceやPigコードの実行をカバーしています。また、Hadoop HIVEやCloudera Impalaテーブル構造の読み込み、書き込みをするためのSAS/ACCESS Interface to HadoopによるLIBNAMEアクセス、SQLパススルーの方法についても触れます。さらにSASとHadoopのテクノロジーとして、DS2、High-Performance Analytics、SAS LASR Server、In-Memory Statistics、これらをサポートするコンピューティング・インフラストラクチャやデータアクセス・メソッドの概要も本コース中に含まれます。

コンテンツ

■イントロダクション
・Hadoopとは?
・HadoopのSASインターフェース
■ファイル管理とHadoopコマンド、Map-Reduce、Pigコードの実行
・HadoopでSASインタラクションを構成するconfig.xmlファイルとjarファイル
・Hadoop FILENAMEステートメント
・PROC HADOOPの使用
■SAS Accessの明示的パススルー
・SQLプロシジャ・パススルー・クエリの作成
・SQLパススルー機能の使用
・Hiveテーブルを定義するEXECUTEステートメントとHVEQL DDL
■SAS/ACCESS LIBNAMEエンジン
・HADOOPのためのLIBNAMEステートメントの使用
・データセット・オプションの使用
・ビューの作成
・テーブルの結合
・LIBNAMEメソッドの利点
・PROC HDMDによる、区切り文字データ、XMLデータ、その他Hive形式でないデータへのアクセス
・SAS/ACCESS LIBNAMEステートメントのためのパフォーマンスの考察
・SASライブラリからHiveライブラリへのデータのコピー
■Base SAS In-Databaseプロセスのパフォーマンス考察
・SAS In-Databaseテクノロジー概要
・HadoopのBase SASプロシジャ
■DS2とHadoop(自己学習)
・DS2とは?
・HPDS2とは?
・メソッド、パッケージ、スレッド
■High-Performance AnalyticsとLASR ServerのためのSASHDATとSASIOLA LIBNAMEエンジン(自己学習)

テキスト

本コースは、英語版のテキストを使用し、日本語で説明を行います。なお、補助資料等はございません。

対象プロダクト

SAS/ACCESS Interface to Hadoop