Using SAS Data Quality Solution to Cleanse Your Data
时间: 2 天
适用对象:
这个第三级别的课程 适合于使用 SAS Data Quality Solution 的 ETL 专家,数据质量分析员,数据仓库架构师和数据仓库技术顾问。
课程描述:
这个两天的课程 讲述了如何使用 SAS Data Quality Solution ( 包括 dfPower Studio, dfPower Match, SAS Data Quality-Cleanse, 和 SAS/Warehouse Administrator Add-in Tools) 进行数据质量清洗。 内容包括:数据质量的要点 ﹑ 数据分析 ﹑ scheme 的创建和标准化 ﹑匹配报告﹑匹配代码生成﹑和验证 。
必备条件:
学习本课程之前 , 你应该完成了课程:《 SAS Programming I: Essentials 》 和《 SAS Programming II: Manipulating Data with the DATA Step 》 的学习或具有相关的经验。
课程内容:
数据质量简介:
DataFlux 技术:
- DataFlux 公司简介。
- dfPower Studio
- 个案研究。
数据分析和标准化:
- 数据分析。
- 数据标准化设计。
- 使用 SAS/Warehouse Administrator 进行标准化。
- 使用 SAS Data Quality Cleanse 进行标准化。
数据转换:
数据解析。
数据转换的函数和过程。
数据匹配:
- 使用 dfPower Match 创建匹配报告。
- 使用 dfPower Match 消除重复。
- 使用 dfPower 附加 match 代码。
- 在 SAS/Warehouse Administrator 中使用 match 代码定义。
- 使用 MATCH 过程。
- 使用 SAS 匹配函数。
确认工作 (Self-Study)
使用产品:
Base SAS, SAS/Warehouse Administrator, SAS Data Quality Solution 。
|