基于HDFS的分布式Namenode节点模型的研究

被引量 : 0次 | 上传用户:yuen370181406
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的飞速发展,数据量的暴增,对像Google、FaceBook、Amazon等大型互联网公司提出了巨大的技术难题——如何对海量数据进行存储管理和处理。为了应对这些挑战,Google公司提出了他们的海量数据存储和处理技术,使用分布式文件系统GFS来存储海量数据,使用MapReduce编程模型来处理海量数据。Hadoop是由Apache发起的对应于Google的GFS、Mapreduce、Bigtable三大核心技术的一个开源项目。Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS的体系架构采用主从结构,一个HDFS集群由一个单一的Namenode和多个Datanode组成。Namenode是HDFS的主服务器,主要负责管理文件系统的元数据。Datanode负责存储文件的数据块。单一的Namenode节点大大简化了系统的架构。Namenode节点负责保管和管理所有的HDFS元数据,可以通过全局的信息精确定位数据块的位置并进行复制决策。但随着数据量的增长,单一的Namenode节点带来的不足不断突出,它主要存在单点失效、单点瓶颈和扩展性差几个问题。对于单点问题,国内外一些学者提出了许多优化方案。但这些方案都是在单一节点的基础上,尽力降低Namenode节点的负荷,但随着数据量的不断增长,文件数量日益增加,部署在HDFS上的应用越来越多,单一的Namenode总有一天会超出它所能承受的范围,由单一的Namenode节点演化成分布式的Namenode节点是HDFS未来发展的方向。本文主要研究基于HDFS的分布式Namenode节点模型,采用多个Namenode节点来为文件系统提供元数据的服务。对于分布式的Namenode节点,元数据的管理十分重要。本文提出一种二级元数据分布算法,将元数据信息分离成目录信息和数据块位置信息两部分,采用不同的分布策略进行分布。二级分布算法在保证高效的元数据服务的基础上,增加了元数据的负载均衡性和可扩展性。同时,为了保证元数据的可靠性,本文还提出了在Namenode集群中元数据的可靠性机制。最后,本文对二级分布算法的性能进行了测试。实验数据表明,二级分布算法在各种极端的情况下也具有很好的性能,同时还有很好的负载均衡性和可扩展性。
其他文献
在当今教育不断改革和发展的背景下,艺术生的群体在不断壮大。众所周知,艺术生文化课成绩普遍偏低,这无疑成了广大艺考生求学路上的一大阻碍。在文化课程中,数学往往又是艺术生最为头疼的学科。因此在教学过程中,如何调动艺术生的数学学习积极性,提升艺术生数学素养一直是人们关注的一个热点。目前,随着课程改革的推进,数学文化受到越来越多的关注。一些学者从数学文化视角探讨了提升中学生数学学业的问题,并提出了相应的数
目的:分析近5年我院95例确诊为结核性腹膜炎患者的主要临床特点,探讨其诊疗方法。方法:对新疆医科大学第一附属医院消化科从2005年1月至2009年12月收治并确诊的95例结核性腹膜
一、概述检验检测机构均应建立和保持管理体系的内部审核(内审)的程序,以验证其运作是否符合管理体系及《检验检测机构资质认定能力评价检验检测机构通用要求》(以下简称通用
探讨转化生长因子β1(TGFβ1)与高氧暴露致肺纤维化发生、发展的关系及其在肺组织的细胞来源,应用免疫组化法结合图象分析处理系统定量研究TGFβ1在高氧暴露致肺纤维化早产大
上世纪70年代年以来,全球气候变化的加剧以及人类活动明显增强,对水资源的影响愈来愈大。气候变化将改变全球水文循环的现状,导致水资源在时空上的重新分配和数量上的改变,从
白细胞介素2(IL-2)是维持细胞免疫功能的重要细胞因子,当受到抗原或有丝分裂原刺激时,能被快速诱导出来,作为自分泌和旁分泌因子参与克隆性的T细胞扩增,影响免疫应答。IL-2可
目的:观察三种植物醇提物,石榴花多酚(PFP)、毛菊苣提取物(CGE)以及鹰嘴豆总皂苷(TSCA)对2型糖尿病(T2DM)大鼠血糖血脂的影响,从不同角度初步探讨其可能的作用机理。方法:140只
近年来,通过解码人体生物电信号进而赋予机器理解人类意图的能力,已成为人机交互领域研究的热点方向。而其中肌电信号具有信噪比高、易采集、模式丰富等特点使得基于其的人机交互受到广泛关注,并己在基于手势、口型识别等人机交互中得到应用。本文研究基于面部动作肌电信号的人机交互技术。由于不同面部动作(如皱眉、眨眼、咬牙等)需要相应的肌肉群不同程度参与,从而导致面部动作肌电信号在位置、幅度、频率等方面存在差异。因
一、港口经济的工业发展当代港口与工业已经紧紧联系在一起,港口已经不仅仅为工业提供运输服务,而且也是现代加工制造业发展的理想场所。从20世纪50年代起,那些原先位于原材
随着经济全球化和国内市场化进程的加快,我国逐渐对外开放石油市场。尽管我国已经是世界上第二大石油消费国,未来石油市场需求旺盛,但石油市场竞争仍将更加激烈。特别是经济