【中国智能制造网 名企在线】在3月19日举办的中国Hadoop技术峰会上,红象云腾与Open POWER基金会共同发布新一代大数据产品,帮助企业高速处理PB规模数据。
此次发布的两款新产品中,“红象数据高铁-CRH4”的Red Hadoop Enterprise CRH4 For POWER版软件,是个支持Open POWER服务器的Hadoop商业版本。同时发布的Red Hadoop Enterprise CRH4 For POWEREC版软件,支持Hadoop HDFS Erasure Code CAPIFPGA加速方案,也是个支持Erasurecode(可擦除码)在FPGA/CAPI上实现的商业发行版Hadoop方案。
用“高铁”比喻Hadoop,源自二者动力原理的相似:高铁的效率比传统火车快,是因为每节车厢都有动力,而不仅仅是火车头有动力。基于分布式技术的Hadoop的原理即把数据分块,通过并行运算来提高数据检索、查询、分析等操作的效率,每台机器都有自己的动力(计算力)与存储,从而提供充沛的动力和功能模块来提升客户的大数据应用环境。
可以看出这两款产品都是为Open POWER服务器定制的。从Open POWER生态的角度看,两款大数据产品的发布也进一步完善了Open POWER的生态链。据北京红象云腾系统技术有限公司总经理童小军介绍,基于Open POWER服务器的开发的Red Hadoop的性能大幅提高。标准的Hadoop测试表明:在Open POWER服务器上的Red hadoop测试值,是在x86服务器上测试值的三倍。同时,Red Hadoop借助FPGA/CAPI来实现Erasure Code加速算法,将原本社区版的三份副本的存储量缩小到原来的一半,大大降低磁盘使用,节省一半磁盘成本,并通过红象Data Bank产品实现界面化操作数据,提高大数据工具使用效率。
据悉,作为Hadoop社区经典难题,ErasureCode(可擦除码)是由Xilinx、IBM中国研究院和红象云腾、恒扬科技、中太、烽火科技等OpenPOWER成员及合作伙伴联合研发的。
“大家都在盼望Erasurecode,这个功能在Hadoop1.0年代存在,但是到了Hadoop2.0年代就被取消了。这其实是非常好的功能,可以大大节省硬盘存储。”中国Hadoop技术峰会主席何建军评价说,“随着我们去年开始倡导第二代分布式计算架构,今天的Erasurecode次真正意义上实现了分布式计算,把CPU不适用的算法挪到了FPGA/CAPI上,而FPGA/CAPI上来计算擦除码是传统软件算法的300倍。我很高兴,今天我们的Hadoop爱好者们可以享受到更好的技术。”
据悉,这一系列产品具备分布式存储和计算功能,支持PB级海量数据存储和批处理、流处理、内存计算、多维查询、搜索引擎等,支持在其前往数据中进行分钟级统计和秒级延迟检索,在在线、近线、离线三大应用场景做场景优化,为用户提供全场景的大数据平台解决方案。与此配套的Redhadoop Databank则成功提升大数据人机交互,通过可视化数据展现和多维度查询,让Hadoop使用更安全,更简单,更快速。
并且这些大数据产品已在联想集团、NTT-DOCOMO、中国航天等企业顺利上线,管理大集群超过100台,数据达到4.8PB规模。其中,联想集团通过红象Hadoop和奥飞ETL,在三个月内完成完成了数据仓库、实时计算、多维查询等应用,出数效率提高到分钟级别。
版权与免责声明:
凡本站注明“来源:智能制造网”的所有作品,均为浙江兴旺宝明通网络有限公司-智能制造网合法拥有版权或有权使用的作品,未经本站授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:智能制造网”。违反上述声明者,本站将追究其相关法律责任。
本站转载并注明自其它来源(非智能制造网)的作品,目的在于传递更多信息,并不代表本站赞同其观点或和对其真实性负责,不承担此类作品侵权行为的直接责任及连带责任。如其他媒体、平台或个人从本站转载时,必须保留本站注明的作品第一来源,并自负版权等法律责任。如擅自篡改为“稿件来源:智能制造网”,本站将依法追究责任。
鉴于本站稿件来源广泛、数量较多,如涉及作品内容、版权等问题,请与本站联系并提供相关证明材料:联系电话:0571-89719789;邮箱:1271141964@qq.com。