SAS/ACCESS® Interface to Hadoop

轻松访问和使用存储在Hadoop中的大数据

充分利用Hadoop的分布式处理架构和极佳的可扩展性,让SAS和Hadoop之间的连接(通过Hive)变得轻松而简单。

产品益处

整合存储在Hadoop和其它数据源中的数据

SAS/ACCESS引擎,支持对多达60种数据源的无缝透明访问。支持的数据源包括关系数据库、非关系数据库、PC文件格式以及数据仓库设备。SAS Data Surveyor支持专用于ERP系统的数据访问引擎。您可以整合存储在Hadoop中的数据和其它数据,轻松地对您企业拥有的所有数据使用SAS分析技术。

轻松直接地访问数据

不要求具有Hadoop或HiveQL专业知识。通过界面可以自动生成相应的HiveQL查询语句,并传送到数据源执行。SAS数据访问引擎让访问数据源变得透明,就好像这些数据源就是SAS本身的数据源一样,可以促进与SAS过程步、SAS数据步和SAS解决方案的集成。您还可以通过数据源原生驱动直接对数据源进行操作。

获得巨大的性能提升

SAS创建了结合Hadoop处理和SAS处理的数据流,通过使用最佳的执行环境,提供最好的性能表现。SAS/ACCESS还支持Hadoop的高性能流加载,提供从各种不同的数据源快速装载数据到Hadoop的能力,包括平面文件和其它关系数据库。

同时支持技术用户和业务用户的使用

它是一种开箱即用的产品,使用时无需太多的培训和知识转移。业务用户通常可以使用SAS报表和分析功能,即可无缝地访问第三方数据。技术用户可以透明地访问数据,或者使用HiveQL直接操作存储在Hadoop(Hive)中的数据。

功能特色

  • 数据访问无缝透明
  • 支持灵活的查询语言
  • 性能特色
  • 元数据的整合
  • 优化

技术信息