View of a report in column display on a desktop monitor

SAS® Data Loader for Hadoop

按照您自己的定义来管理大数据,自助式的数据整合与数据质量管理

将数据加载到Hadoop或从中导出,使之可用于生成报表、可视化展现或进行高级分析,您自己快速、轻松地就能做到。SAS Hadoop数据加载器(SAS Data Loader for Hadoop)让您无需编写代码即可管理您的数据。

产品益处

轻松管理数据  无需特别技能

自助进行数据整合、数据质量管理和数据加工,无需编写复杂的MapReduce代码或寻求外部帮助。SAS的Hadoop数据加载器弥补了用户技能上的差距,让用户可以轻松地访问他们的数据,无需太高的技能要求。

提升可扩展性和性能

让业务用户易于使用。数据科学家和SAS程序员能够提高处理速度、效率和灵活性。代码加速器帮您利用Hadoop的能力,基于Spark内存处理技术的数据质量功能进一步提升性能。而且,通过数据迁移的最小化,提高了数据的安全性。

释放IT资源来完成更多技术工作

当数据科学家们忙于处理基础的数据管理工作时,就无法发挥他们的高级分析技能,从而对业务造成影响。SAS Hadoop数据加载器可以降低IT任务的压力,让您的系统更好、更快、更强大。

从您的大数据中获得更多价值

您可以很轻松地将数据从关系数据库或SAS数据集加载到Hadoop中。您可以刻画数据特征、清洗数据、连接和转化大数据,带来无限的业务机遇,加强高级分析的能力。

SAS数据专家Matt Magne解释了为什么SAS Hadoop数据加载器可以降低Hadoop的使用技能要求,让您可以轻松准备、整合和清洗大数据。

屏幕截图

功能特色

View of a report in table display on a laptop monitor
  • 直观的用户界面  通过基于Web的界面,轻松访问、转换和管理存储在Hadoop中的数据,无需繁重的培训。
  • 专用于Hadoop数据的加载和导出  专为管理Hadoop大数据而设计开发,并非借用现有的IT工具。
  • 大数据质量和特征刻画  通过大小写转换、性别分析、模式分析和字段抽取等功能,加上在Hadoop集群上并行运行高性能的特征刻画,可以数据准确且准备到位,方便后续处理。
  • 指令的链接与调度  对多个指令进行分组,支持并发运行或逐个运行。通过开放的公共API进行指令的调度和自动执行。

    • Spark上的数据管理  在Spark上支持在内存中直接运行数据质量管理功能。Spark提供的匹配功能和最佳记录创建功能支持大数据的主数据管理,您可以随需读写Spark数据。
    • 大数据整合  将CSV和其它分隔符文件中的数据导入Hadoop。此外,您还可以运行HiveQL命令和在Hadoop表中删除记录。
    • 内存分析服务器  将数据加载到内存进行数据准备,用于高性能的报表、可视化和分析。
      • 分布式的代码执行和数据质量处理  直接在Hadoop中进行数据分析和数据质量处理,快速得到结果。最小化数据迁移,提高扩展能力、数据治理和性能。



        技术信息

        Back to Top