SAS® Hadoop 数据加载器

以您自己的方式通过自助数据准备管理大数据。

将数据加载到 Hadoop 和数据湖中或从中加载数据。准备数据,以便在数据湖中进行报告、可视化或高级分析。快速而轻松地自行完成所有操作。

交互式用户界面

通过基于 Web 的界面轻松访问、转换和管理存储在 Hadoop 或数据湖中的数据,从而减少培训需求。

专为将数据加载到 Hadoop 或从中加载数据而构建

从头开始构建,以管理 Hadoop 或数据湖中的大数据;而不是将以 IT 为中心的现有工具重新调整用途。

链接和调度指令

允许您将多个指令分组,以同时或逐个运行。使用公开的公共 API 调度和自动化指令。

协作和安全

使您能够共享和保护指令。从 SAS Data Integration Studio 中调用指令,以联合技术和非技术用户活动。

大数据质量和剖析

包括内置指令 – 大小写、性别和模式分析、字段提取、匹配合并和群集生存。在 Hadoop 群集上并行运行剖析,以提高性能。

大数据质量和剖析

可让您在内存中加载数据,以便为高性能报告、可视化或分析做好准备。

群集内代码与数据质量执行

在 Hadoop 中执行分析和数据质量处理,以快速获得符合预算的结果。最大限度地减少数据移动,以提高可扩展性、治理和性能。

大数据集成

将数据从 CSV、SAS/ACCESS® 库、云源、关系数据库和其他带分隔符的文件导入 Hadoop。运行 HiveQL 和 Impala SQL。

通过自助数据准备控制您的数据并解放 IT 资源。

在台式电脑显示器上的 SAS Hadoop 数据加载器显示 Hadoop 指令中的清理数据

管理数据,不需要特殊技能。

自行执行数据集成、数据质量和数据准备任务,无需编写代码或寻求专业帮助。SAS Hadoop 数据加载器可弥补技能差距,无论技术能力如何,所有用户都可以访问其数据。

管理数据,不需要特殊技能。

商业用户将发现它易于使用。数据科学家和 SAS 编码员喜欢它的速度、效率和敏捷性。代码加速器利用 Hadoop 的功能,而数据质量功能在 Spark 的内存中运行,旨在提升性能。通过最小化数据移动,您可以提高数据的安全性。

在台式电脑显示器上的 SAS Hadoop 数据加载器显示用于选择 SQL 环境的功能
在台式电脑显示器上的 SAS Hadoop 数据加载器显示配置文件报告

确保大数据质量。

控制数据湖环境中的数据。SAS Hadoop 数据加载器可用于剖析数据,以了解其整体质量。然后,您可标准化、解析、匹配和执行其他核心数据质量功能,从而在数据湖中生成满足业务需要的质量数据。

使用 Spark 加快数据管理过程。

数据质量功能在 Apache Spark 的内存中运行,旨在提升性能。匹配和最佳记录创建可实现大数据的主数据管理。此外,您可根据需要读取并写入 Spark 数据集。

在台式电脑显示器上的 SAS Hadoop 数据加载器显示群集生存指令

Back to Top