HDFS上のテキストファイルにアクセスしたい
[OS] ALL
[リリース] 9.3, 9.4
[キーワード] FILENAME HADOOP
[質問]DATAステップでHDFS(Hadoop Distributed File System)上のテキストファイルを直接読み書きすることは可能でしょうか。
[回答]FILENAME HADOOPステートメントを使用することにより可能です。 例)
FILENAME cfg "hadoop.cfg";
DATA _NULL_;
FILE cfg;
INPUT;
PUT _infile_;
DATALINES4;
<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://localhost:8020</value>
</property>
<property>
<name>mapred.job.tracker</name>
<value>hdfs://localhost:8021</value>
</property>
</configuration>
;;;;
FILENAME foo HADOOP "/user/XXXXX/test.csv"
CFG=cfg USER='XXXXX' PASS='XXXXX' RECFM=V;
DATA _NULL_;
INFILE foo TRUNCOVER DLM=',';
INPUT c1 c2 :$5. c3 :$50.;
PUT c1= c2= c3=;
RUN;
FILENAME HADOOP ステートメントの詳細については下記資料をご参照ください。 "Installation Note 48767: Installation and configuration requirements for the HADOOP procedure and the FILENAME HADOOP engine" "FILENAME Statement, Hadoop Access Method" 「SAS 9.4ステートメントリファレンス」第2章 SASステートメントのディクショナリ、FILENAMEステートメント, Hadoopアクセス方式
|
|