基于HDFS的文件访问性能优化技术研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:xichblueagle
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Hadoop作为优秀的基础云平台架构被广泛应用于云计算应用和大数据计算处理,其分布式文件系统HDFS为海量数据提供了基础存储服务。随着信息数据总量和类型的急剧增加,如何满足海量数据的高效访问和高可靠性存储成为Hadoop存储系统性能优化研究的关键问题。本文基于Hadoop集群中HDFS的文件存储及管理模式探讨了的文件访问性能优化技术,重点围绕HDFS小文件和冗余副本动态更新两个问题展开了深入研究。在展开研究工作前,首先深入研究并分析了Hadoop架构下分布式存储系统的原理及特点,并重点论述了已有的HDFS小文件访问性能优化和冗余副本优化技术,总结前人研究成果的优点和应用价值,结合访问负载特征和应用实际,指出其各自的局限性。本文主要的研究内容和贡献包括:一、针对HDFS的小文件问题,提出了基于历史数据的小文件预取方法,主要包含元数据推送和数据块预取两部分。元数据推送由NameNode进行,推送的依据为历史访问记录中所体现的数据访问的重复性和时间局部性特征,当历史数据中存在与当前读请求重复的访问记录时,即触发元数据推送。数据块预取由DataNode进行,客户端接收到推送的元数据后,将其存储到节点本地的元数据缓存,缓存能够为后续读请求提供更快速的元数据请求响应,并在后台触发预取模块,将缓存中元数据所指向的数据块提前预取到DataNode。实验结果证明,基于历史数据的小文件预取方法确实能够缩短大量小文件读请求的响应时间,满足存储系统访问性能的优化需求。二、针对冗余副本动态更新问题,提出了基于元数据缓存的动态副本多播算法,主要包含副本生长退化和元数据多播更新两部分。副本生长退化以文件访问热度为依据,元数据缓存实时记录本地客户端对文件及数据块的访问次数并结合时间周期计算热度,指导DataNode数据副本进行动态增减。元数据多播更新以产生副本变化的DataNode作为多播源,依据集群拓扑结构采用层次化的多播形式传递元数据更新消息,减轻NameNode负载,加快更新消息传递。实验结果证明,基于元数据缓存的动态副本多播方法能够适应数据访问负载变化,减少“冷数据”副本所占用的存储资源,为“热数据”提供更高效的数据访问性能。本文对HDFS的小文件访问性能和动态副本策略的优化进行了探索,研究成果对于完善Hadoop集群的存储架构和功能,尤其是HDFS在面向大规模数据存储和处理时的性能提升具有一定的理论价值和实践意义。
其他文献
网络安全态势感知能够大幅提升大规模网络的整体安全性,是目前网络安全领域的研究热点。本文主要围绕网络安全态势感知中的数据融合技术进行研究,通过构建科学合理的网络安全
为了解决网络服务质量(Quality of Service,QoS)问题,本文深入的研究了区分服务网络的结构和特性,并将带宽代理引入区分服务网络(DiffServ),制定动态的资源管理方案,从而提高数据
分布式拒绝服务(DDoS,Distributed Denial of Service)攻击是当前互联网存在的重要安全威胁。随着Internet规模的不断扩大和网络带宽的不断提升,网络DDoS攻击的流量也随之增
随着转录调控领域相关数据则增加,国际上已出现有关调控区,调控单元和转录因子和结合位点的数据库,比较著名的有Transfac,Trrd,Jaspar等。然而大量的有关于转录调控信息主要
随着网络的迅速发展,网络安全越来越被人们所关注。作为防火墙有力的补充,入侵检测系统(IDS)已经成为网络安全领域的研究热点。 入侵检测本质上可以看作是一个分类问题,即通
虚拟现实技术被广泛的应用在虚拟军事训练、三维游戏、系统样机设计、虚拟制造、虚拟外科手术、城市规划及虚拟远程教学等领域。在虚拟现实中,阴影是一个非常重要的部分,它能
随着WWW的迅速发展和普及,WWW成为一个巨大的信息资源库,对这个信息资源库的搜索出现了“信息过载”和“信息迷航”的问题。由于WWW的自治性、开放性、异构性、动态性和指数
随着计算机、网络、无线通信以及多媒体技术的飞速发展,无线视频图像传输系统现已成为科研领域的一大热点。现有的无线视频图像传输系统的典型应用是无线监控系统,可以解决有线
随着无线通信与网络技术的迅猛发展,人们获得的移动服务越来越普及,越来越多样化,下一代无线通信网络将承载话音、数据、多媒体业务,需要支持高速率、高可靠性的数据传输,提
贝叶斯网是图形表示和概率知识的有机结合,它揭示了领域对象的内在联系,是复杂全概率分布的紧凑表达方式。其坚实的理论基础,知识结构的自然表述,灵活的推理能力以及方便的决