适用于 Teradata 的 SAS® 数据质量加速器特征
大小写
- 确保在数据列中使用适合上下文的大小写。
提取。
- 从文本字符串中提取特定于上下文的实体或属性。
性别分析
- 确定名称的性别。
识别分析
- 确定由文本字符串表示的数据类型。
解析
- 将字符串分割为单独的离散实体。
模式分析
- 显示文本字符串的字符模式的简单表示形式。它用于确定是否需要进一步的数据质量处理。
标准化
- 为列中的所有值输出首选(输出)格式,以确保一致性。
匹配代码生成
- 为文本字符串生成“匹配代码”。匹配代码用于相关但不完全相同信息之间的模糊匹配比较。