云上运行Hadoop 哪些问题需注意？

2016-06-03 13:43:16来源：云栖博客原标题：云上运行Hadoop 会面临哪些挑战关键词：云计算 Hadoop 云平台阅读量：32285

导读：在云上运行Hadoop，很多人担心性能。因为一提到虚拟化就会有人想到有成本，往往得出有偏见的结论-在云上运行肯定比物理机器上运行性能差。

　　【中国智能制造网技术前沿】在云上运行Hadoop，很多人担心性能。因为一提到虚拟化就会有人想到有成本，往往得出有偏见的结论-在云上运行肯定比物理机器上运行性能差。如果单独把10台物理机虚拟化跑Hadoop，这肯定是有部分性能的开销的。但是如果在公共云上，情况就不是这样了。因为公共云虚拟化的开销终是由平台方来承担的，其一是平台方采购机器有规模优势，其二平台方可以在保证虚拟机性能的情况超卖部分资源。

云上运行Hadoop 哪些问题需注意？

　　
　　平台卖给用户8core32g的虚拟机就保证有这个规格的能力的。结合云上的弹性优势，企业的总体成本是会下降的。
　　
　　在云上运行Hadoop对平台方还是面临一些挑战的，下面主要讲述这些挑战及平台方怎么解决的。
　　
　　云上Hadoop的挑战-Shuffle
　　
　　Shuffle分为Push模式，Pull模式。Push模式就是直接通过网络发送到下一个节点，比如：storm、flink。Pull模式就是数据先存储在本地，再启动下一个节点拉取数据，比如：HadoopMR、Spark。
　　
　　在push模式下，主要瓶颈点是网络。在一般的云环境中，网络跟线下没有太多的区别，可以满足需求。
　　
　　在pull模式下，主要瓶颈点是磁盘。在云环境中，会提供本地磁盘或者用SDD加速的方案。如下：

SDD加速方案

　　
　　另外：
　　
　　根据spark社区的报告，在机器学习等很多场景下，瓶颈点现在是CPU了
　　
　　云上Hadoop的挑战-数据本地化
　　
　　数据本地化含义是分析时，把计算移动到数据节点的。如果计算存储分离，则存在数据放在OSS中，需要从OSS远程拉取数据。一般情况下，认为这样会有性能问题。

从OSS远程拉取数据

上一篇：物联网上演技术之争三大主流技术有何区别？

下一篇：PennState开发出新型3D打印技术可快速原型

我要评论

CDCE2025数据中心展11月上海开幕在即六大技术路径引领算电协同，驱动绿色算力变革
CDCE国际数据中心及云计算展览会/CDCE绿色智算中心及算力产业展览会】将于2025年11月18-20日在上海新国际博览中心隆重召开，同期联动【EP电力展】【ES储能展/氢能展】。
数据中心云计算智能制造
2025-10-27 13:21:56
2025世界计算大会专题展优秀技术、产品及应用成果火热征集中！
2025世界计算大会同期将举办2025世界计算大会专题展，本次专题展以“智算驱动新质生产力”为主题，聚焦计算技术前沿、成果应用、产业赋能等领域，集中展示全球计算领域最新技术、产品及应用成果。
世界计算大会量子计算云计算
2025-10-13 11:40:29
工信领域有哪些重要政策和大事要闻？一文速览→
工业和信息化部等七部门近日联合印发《深入推动服务型制造创新发展实施方案(2025—2028年)》；近日，工业和信息化部与国家标准委联合印发《云计算综合标准化体系建设指南(2025版)》......
服务型制造云计算
2025-10-13 09:36:26
两部门关于印发《云计算综合标准化体系建设指南（2025版）》的通知
《云计算综合标准化体系建设指南（2025版）》提出，到2027年，新制定云计算国家标准和行业标准30项以上，不断健全云计算产业标准体系。开展标准宣贯和实施推广的企业超过1000家，以标准赋能企业数字化转型升级的成效更加凸显。加快云计算领域国际标准供给，促进产业全球化发展。
云计算云平台软件
2025-10-10 09:07:31
2025云栖大会剧透来了！今年有这些AI新看点
2025云栖大会以“云智一体·碳硅共生”为主题，为期三天，设三大主论坛和110余场聚合话题，预计将有来自50多个国家的2000余位嘉宾出席。
云栖大会云计算人工智能
2025-09-17 09:49:56
打造无处不在的“企业一朵云”！华为云加速千行万业智能化转型
作为华为云分布式云的核心产品，CloudPond是将华为云基础设施和云服务部署到客户指定区域，给客户提供本地的华为云原生服务，且保持与华为云一致的使用体验。
华为云云计算
2025-08-29 13:36:07

版权与免责声明：

凡本站注明“来源：智能制造网”的所有作品，均为浙江兴旺宝明通网络有限公司-智能制造网合法拥有版权或有权使用的作品，未经本站授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的，应在授权范围内使用，并注明“来源：智能制造网”。违反上述声明者，本站将追究其相关法律责任。

本站转载并注明自其它来源（非智能制造网）的作品，目的在于传递更多信息，并不代表本站赞同其观点或和对其真实性负责，不承担此类作品侵权行为的直接责任及连带责任。如其他媒体、平台或个人从本站转载时，必须保留本站注明的作品第一来源，并自负版权等法律责任。如擅自篡改为“稿件来源：智能制造网”，本站将依法追究责任。

鉴于本站稿件来源广泛、数量较多，如涉及作品内容、版权等问题，请与本站联系并提供相关证明材料：联系电话：0571-89719789；邮箱：1271141964@qq.com。