面向Hadoop存储系统的节能优化技术研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:qin6668
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,基于云计算的互联网服务不断涌现,其中MapReduce计算范式和HDFS分布式文件系统已逐渐成为开发大型数据密集型应用的首选模型。从硬件供应商的角度,这类应用部署的规模如此巨大,降低服务集群的功率消耗既可以显著降低运营成本,又能降低碳排放量,从而提高整体能效。在传统服务器节能策略的基础上,针对提供MapReduce作业服务的集群,提出一种节能优化算法。该算法能根据集群当前整体和局部的工作负载动态地重构节点或节点上的数据;同时,控制数据放置策略很好的支持上述操作。该节能优化算法具备了节能效果明显、实时性高以及负载均衡开销小等特性,可应用于数据密集型计算集群和企业数据中心等环境中。具体地,实现节能优化的能耗控制系统由数据分发模块、节点失效模块和能耗调节模块三个组件组成。数据分发模块通过对HDFS数据块分发和对应副本放置流程进行修改,实现人为控制数据块号到DataNode节点映射;节点失效模块使得HDFS具备容忍节点增加/缺失的功能;能耗调节器是提高能效的核心,包含两个线程,分别对应两种算法:dilution和enrichment。在集群的某个机架利用率高于管理员预定的阈值时,能耗调节模块会根据dilution算法适时地添加新节点,并将附近节点上的数据迁移到新节点上;当集群出现某个机架的利用率偏低时,能耗调节器可依据enrichment算法移除目标节点,并其上的数据迁移到附近节点上。从而,实现系统当前工作负载与系统性能的动态匹配。在最终测试方面,利用GridSim Toolkit对节能优化算法从功能和节能效果两个方面进行了测试和评估,前者主要验证了enrichment和dilution算法是否能在集群负载变化时重构节点或者数据;后者着重测试了在平均负载和低负载条件下节能的效果,并与传统Covering Set技术进行了比较。实验结果表明提出的节能优化算法在MapReduce计算中高负载情况下能达到30.32%的节能效果,在低负载情况下能达到69.77%的节能效果。
其他文献
随着计算机技术的不断发展,基于计算机视觉的智能控制与人机交互得到越来越多人的关注。能够满足人们大量数据交互需求的新型人机交互技术是未来计算机发展的趋势之一。手势跟
网络海量数据的出现,对系统的存储管理和访问提出新的要求,存储系统一般需要兼顾一致性、可用性和容错性中的两种,传统的关系型数据库因缺乏面对复杂数据的应变,而逐渐被淘汰。分
钻井作业是一项高风险的系统工程,如果不切实做好防范工作,那么可能会对钻井作业周边的自然生态环境造成难以消除的影响。随着理论数学和计算机相关技术的不断发展,关于钻井
心电信号的检测是心脏疾病临床诊断中的重要环节,如何增加心电信号采集的精度、降低噪声干扰、提高心电信号检测的效率一直是心电信号检测研究的核心问题。本文主要从三个方
作为新一代的软件架构,面向服务的体系架构SOA (Service-Oriented Ar-chitecture)具有松耦合、开放和平台及实现语言独立的特性,为服务的重用和跨平台的业务整合与交互提供了
近年来互联网的飞速发展,相关技术的日益成熟,同时各种网络应用给我们的日常生活带来了极大的方便,因此带动了互联网用户爆炸式的增长。互联网已成为我们生活,工作和学习等方
防火墙是最广泛部署的安全机制之一,其有效性取决于网络过滤策略的配置。如今,防火墙策略异常检测与处理技术已经普遍应用于现实场景中。在防火墙中存在异常策略时,系统会对
随着信息技术的快速发展,信息管理系统逐渐开始普及。大部分企业及高校开始构建自己的信息管理系统,用来规范管理日常办公流程,提高工作效率。在传统软件应用模式下,对于每个
相关向量机是一种基于稀疏概率模型的机器学习方法,与机器学习中分类回归领域得到了广泛应用的支持向量机在体系结构和功能运作上十分接近,从而较好地吸收了支持向量机泛化能
在实现嵌入式系统的过程中,软硬件协同设计技术通常需要考虑在缩短上市时间的基础上满足各种设计约束。协同设计的一个关键要求是对系统模块进行一个有效的软硬件划分,在满足功