SAS® Hadoop 数据加载器

以您自己的方式通过自助数据准备管理大数据。

将数据加载到 Hadoop 和数据湖中或从中加载数据。准备数据,以便在数据湖中进行报告、可视化或高级分析。快速而轻松地自行完成所有操作。

交互式用户界面

通过基于 Web 的界面轻松访问、转换和管理存储在 Hadoop 或数据湖中的数据,从而减少培训需求。

专为将数据加载到 Hadoop 或从中加载数据而构建

从头开始构建,以管理 Hadoop 或数据湖中的大数据;而不是将以 IT 为中心的现有工具重新调整用途。

链接和调度指令

允许您将多个指令分组,以同时或逐个运行。使用公开的公共 API 调度和自动化指令。

协作和安全

使您能够共享和保护指令。从 SAS Data Integration Studio 中调用指令,以联合技术和非技术用户活动。

大数据质量和剖析

包括内置指令 – 大小写、性别和模式分析、字段提取、匹配合并和群集生存。在 Hadoop 群集上并行运行剖析,以提高性能。

大数据质量和剖析

可让您在内存中加载数据,以便为高性能报告、可视化或分析做好准备。

群集内代码与数据质量执行

在 Hadoop 中执行分析和数据质量处理,以快速获得符合预算的结果。最大限度地减少数据移动,以提高可扩展性、治理和性能。

大数据集成

将数据从 CSV、SAS/ACCESS® 库、云源、关系数据库和其他带分隔符的文件导入 Hadoop。运行 HiveQL 和 Impala SQL。

通过自助数据准备控制您的数据并解放 IT 资源。

管理数据,不需要特殊技能。

自行执行数据集成、数据质量和数据准备任务,无需编写代码或寻求专业帮助。SAS Hadoop 数据加载器可弥补技能差距,无论技术能力如何,所有用户都可以访问其数据。

管理数据,不需要特殊技能。

商业用户将发现它易于使用。数据科学家和 SAS 编码员喜欢它的速度、效率和敏捷性。代码加速器利用 Hadoop 的功能,而数据质量功能在 Spark 的内存中运行,旨在提升性能。通过最小化数据移动,您可以提高数据的安全性。

确保大数据质量。

控制数据湖环境中的数据。SAS Hadoop 数据加载器可用于剖析数据,以了解其整体质量。然后,您可标准化、解析、匹配和执行其他核心数据质量功能,从而在数据湖中生成满足业务需要的质量数据。

使用 Spark 加快数据管理过程。

数据质量功能在 Apache Spark 的内存中运行,旨在提升性能。匹配和最佳记录创建可实现大数据的主数据管理。此外,您可根据需要读取并写入 Spark 数据集。