基于HDFS光盘库的磁盘缓存系统的设计与实现

来源 :南京航空航天大学 | 被引量 : 1次 | 上传用户:limitfly
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来,全球每天产生的数据总量高达PB级,数据总量规模也越来越大。但是这些数据只有很少一部分经常使用,大部分数据在很长一段时间内都不会被访问。若是将所有的数据都存储到磁盘阵列中,将会带来高昂的存储成本和数据管理成本。随着光盘技术的发展,由于其单位存储成本低、容量大、安全性高、能耗低等优点,被应用到各种冷数据备份系统中。目前市场上出现一种基于光盘库的Hadoop分布式文件系统(HDFS光盘库),HDFS光盘库与传统的光盘库相比,在系统容量和数据传输速度方面都得到了很大的提升,但是仍然和磁盘之间存在很大差距。本课题正是为解决HDFS光盘库和磁盘存储设备之间的差距而进行的研究。论文首先研究HDFS光盘库系统的结构特点,以及HDFS文件系统中小文件存储优化方案,针对HDFS光盘库内合并的小文件之间关联性较低的问题,本文提出了一种基于文件名的标签分类算法,并在虚拟存储模块内根据文件标签信息设计小文件合并策略。然后研究国内外缓存替换算法和预取技术,结合文件标签信息和系统内调度对象,提出了一种基于文件标签的LB-LRU算法(Label Based Least Recently Used),该算法有效地提高了磁盘缓存系统的缓存命中率,在Cache模块内设置文件预取策略提高磁盘缓存系统的缓存命中率。最后针对传统HDFS光盘和加入磁盘缓存系统的HDFS光盘在文件读写性能和NameNode内存消耗进行性能测试,同时对磁盘缓存系统内标签分类算法和LB-LRU算法的性能进行测试,测试结果表明磁盘缓存系统可有效的提高文件读写能力,降低HDFS光盘库的内存消耗。
其他文献
本文提出了结合分层的剪切位移法、摄动法和随机场理论来计算柔性桩沉降可靠度的简化方法,并用随机有限元和蒙特卡洛模拟法对此简化模型的精度进行了对比分析,分析结果表明该方
由于城门洞形和马蹄形断面输水管道中的临界水深,共轭水深的计算公式和计算曲线尚缺乏现成的资料。为工程上参考,使用的方便性,本文利用水流动量方程,分析这现任中最常用的输水管
在党的建设和国家治理体系中,纪检监察工作是不可或缺的重要内容。新时代不断巩固发展反腐败斗争压倒性胜利和推动全面从严治党向纵深发展,不仅需要各级党委和政府的正确领导,同时需要一支高素质专业化、忠诚干净担当的纪检监察干部队伍。地方纪检监察干部队伍作为纪检监察干部队伍的一支,于纪检监察工作中,起着不可替代的特殊作用。加强地方纪检监察干部队伍建设,是落实全面从严治党的必然要求,是新时代巩固发展反腐败斗争压
解题错误是数学学习过程中常见的现象之一,许多学生没有及时发现和改正所犯的错误,导致数学学不好,终生害怕数学,因此在中等教育阶段打好数学基本功,对人一生的成长尤为重要
简要介绍了双膨胀水泥混凝土在湖南凌津滩水电工程的应用试验,进行了双膨胀混凝土现场取样检验和原型观测,结果表明:双膨胀混凝土兼有早期和后期微膨胀性能,从而能有效地补偿大体
随着新课程改革工作的不断推进,教育相关部门开始提倡教师应极力提高教学质量.在这篇文章中,笔者将简要阐述教师可采用提问教学法,在班上组织小组合作学习活动以及鼓励学生主
软连接是发电机与外部设备连接的重要过度部件,其固定、连接方式直接影响机组的安全运行。本文介绍了某燃气轮机发电机中性点软连接烧损的经过,通过现场试验数据和损坏情况对
为了深入研究某重型燃气轮机燃烧室的燃烧性能,在燃烧性能试验基础上,本文建立了包括扩压器、旋流器、火焰筒等部件在内的环管燃烧室全尺寸UG模型和数学模型。用Realizable k-
针对室内到达时差(TDOA)定位的非线性方程求解问题,提出一种改进的哈里斯鹰优化定位算法,在提升原算法性能的基础上保留其寻优机制。对基于最大似然估计的适应度函数进行改进
介绍了汽车灯罩壳体的结构特点,设计了普通流道与热流道相结合的潜伏浇口注射模,采用多个侧抽芯机构解决了塑件多处细节特征的脱模难题,实现了塑件的自动化生产;并对模具的浇