适用于 Teradata 的 SAS® 数据质量加速器特征

大小写

  • 确保在数据列中使用适合上下文的大小写。

提取。

  • 从文本字符串中提取特定于上下文的实体或属性。

性别分析

  • 确定名称的性别。

识别分析

  • 确定由文本字符串表示的数据类型。

解析

  • 将字符串分割为单独的离散实体。

模式分析

  • 显示文本字符串的字符模式的简单表示形式。它用于确定是否需要进一步的数据质量处理。

标准化

  • 为列中的所有值输出首选(输出)格式,以确保一致性。

匹配代码生成

  • 为文本字符串生成“匹配代码”。匹配代码用于相关但不完全相同信息之间的模糊匹配比较。