【摘 要】
:
随着互联网技术的飞速发展,互联网中的数据总量不断攀升,数据已经成为重要的国家基础性战略资源。由于传统存储系统难以突破存储容量的限制,分布式存储系统越来越受到业界的青睐。其中,HDFS被广泛应用于各类大数据应用系统中完成海量数据的存储。同时,随着硬件技术的快速发展,读写速度更快的存储介质不断地出现并得以应用,例如固态硬盘。因此,随着HDFS系统不断扩展和迭代演化,HDFS的集群形态由初期的同构化逐渐
论文部分内容阅读
随着互联网技术的飞速发展,互联网中的数据总量不断攀升,数据已经成为重要的国家基础性战略资源。由于传统存储系统难以突破存储容量的限制,分布式存储系统越来越受到业界的青睐。其中,HDFS被广泛应用于各类大数据应用系统中完成海量数据的存储。同时,随着硬件技术的快速发展,读写速度更快的存储介质不断地出现并得以应用,例如固态硬盘。因此,随着HDFS系统不断扩展和迭代演化,HDFS的集群形态由初期的同构化逐渐演变为异构化,集群中通常会同时存在多种存储介质。那么在异构集群的新常态下,如何高效地实现文件副本的读写,合理地使用各种存储介质,是异构HDFS环境下亟待解决的关键问题。然而不幸地是,HDFS设计之初就是面向同构环境考虑的,默认的副本放置策略、管理策略和检索算法都是面向同构环境设计的,它们在异构环境下存在诸多的不足。在副本放置和检索方面,HDFS在选择放置副本或提供读取服务的节点时仅仅考虑了网络距离,而未考虑节点的异构性和实时性能的差异,容易造成节点负载失衡的问题;在副本管理方面,HDFS采用静态副本管理策略,文件副本一旦完成初次放置其位置和数量便不再发生改变,没有考虑到文件访问性能将随时间发生变化,容易造成分配不合理进而导致空间浪费和系统整体性能低下的问题。为了解决这些问题,本文首先使用“文件热度值”对文件的访问特性进行量化,同时为不同热度值的文件分配不同的异构存储策略。通过定时更新文件的实时热度值,使得系统能实时感知文件访问特性的变化进而在副本位置和数量上做出相应的调整,实现文件副本的动态管理;其次,本文使用“综合负载值”对节点的实时性能进行量化,并提出了基于层次分析法的计算方法。通过定时更新节点的综合负载值,使得系统能及时地获取各个节点的实时状态,进而构建多级全局服务队列并利用基于节点服务队列的负载均衡算法完成读写请求的分发,实现数据节点层级的负载均衡。通过这样的方式,本文实现了对HDFS副本放置、管理和读取的全链条流程优化。经实验验证,优化后系统能够根据文件的访问特性变化实时地调整副本的位置和数量,HDFS的写入速度平均提高5.35%,读取速度平均提高11.84%,同时读取数据时命中固态硬盘的次数显著增加。总之,通过本文的优化,从整体上提升了HDFS系统的I/O效率,缩短了读写的时延,降低了系统的存储成本,同时也保证了系统中各节点的均衡性。
其他文献
版权技术措施是指权利人所主动使用的,能够实现对权利人作品的保护,以使其在使用、传播的过程中不被侵犯,从而保障权利人合法权益的手段、设备或装置。随着数字化科技的迅猛发展与网络时代的到来著作权人的利益面临着不小的挑战,版权技术措施因其对著作权及正义、效率等价值的保护普遍受到国际条约及各国立法的保护。但我国现行立法中对于版权技术措施的规定存在立法体系混乱、价值取向不符合我国国情、技术措施保护范围不合理、
原银监会在其发布的107号文中首次提到了要探索信托受益权的流转机制。要求建立完善的信托产品登记信息系统,探索信托受益权流转,推动信托产品的流动性,促进信托行业转型。信
我国《公司法》规定有限责任公司的股东有权进行股权转让,其股权转让既可以发生于股东内部,也可以发生于股东与股东外第三人之间,但《公司法》未规定无权处分情形下,股权转让
随着科技的飞速发展,社会的不断进步,众多领域都迫切需要高效的身份验证方式。人脸作为个人独有的身份标识,具有交互性好、难以伪造等优点,因此可以利用人脸进行个人身份的验
在面对未知的,模糊的情境时一个人会产生焦虑、恐惧,或者吸引和神秘感,这种对不确定的厌恶,企图寻找确定答案来结束模糊感的动机就是认知闭合需要(Kruglanski,2004)。大量的研究证实了认知闭合需要在个人、人际和群体行为中发挥着相当大的作用,并且它与人类事务中重要的知识构建过程有关:在个人层面上,认知闭合需要影响社会判断、态度和印象形成。在人际层面,它影响沟通和说服、共情和谈判行为,在群体层面
再制造工程通过对局部损伤的零件采用先进的表面工程技术等手段进行修复和强化,从而使零件继续使用,以延长难制造、高价值零件的使用寿命,是实现循环经济“减量化、再利用、资源化”的重要途径。电子束熔丝沉积技术因其高的能量密度和沉积效率、成本低廉的熔覆丝材及真空的加工环境等特点,已成为一种新兴的再制造技术。电子束熔丝沉积涂层的晶粒细小、生长取向良好,具有优异的表面综合性能和良好的冶金结合,可实现对高精密复杂
在司法领域,当个人或者集体利益受到侵害时,需要供一种安全的证据存储方式辅助案件的判决,这一过程称之为存证。为了高处理民事纠纷等问题的效率,传统的纸质化存证方式逐渐被
在科技飞速发展的今天,云计算极大地改变了人们的习惯,无论是生活还是工作,越来越多的人开始依赖云计算相关的产品。在数据存储方面,由于云计算具有易扩展、低成本,使用便利
针对二维线性判别分析在进行人脸图像投影时投影矩阵非正交、仅对行或列方向提取特征时容易丢失不同行或列间有助于鉴别分析的协方差信息、同时存在特征维数较高的问题,提出了广义二维复判别分析的人脸识别方法。该方法包含所提出的两种新方法,即新的广义二维线性判别分析方法和新的二维复判别分析方法。本文首先采用新的广义二维线性判别分析及其扩展方法处理人脸图像,根据特征值贡献率动态选取特征向量组成正交投影矩阵,完成水
针对传统数字水印技术将水印信息嵌入到载体中存在嵌入的水印信息少容易遭受攻击,嵌入的水印多又影响载体可观性等问题,提出了零水印算法。算法采用Schur分解技术提高效率、减少误报,双重加密增强安全性。首先提取原始载体的低频块并进行Schur分解获取稳定值,进一步通过上三角矩阵构建过渡矩阵,然后将该矩阵元素的平均值与矩阵的元素一一对比构造特征矩阵。嵌入载体的水印信息经过混沌映射和斐波那契变换双重加密后,