HDFS下海量小文件高效存储与索引方法

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:dingdang19822003
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分布式文件系统HDFS被用来存储大文件,若在其中存储海量小文件将会严重消耗Name Node内存,影响系统性能,同时小文件也不利于使用MapReduce框架进行并行处理和分析.另外,小文件附带的多维元信息也需要以一种合理的方式进行存储和索引以便于查询.本文针对以上问题,提出一种基于多维列索引的小文件管理方案,支持文件的并发上传、下载及删除操作,并在多个查询维度上提供文件的自由检索.本文提出的小文件合并方案能够明显减少HDFS上的文件数量,经过实验对比,在小文件元信息的查询效率方面,本文提出的多维索引方案优于HBase,同时保证了文件传输的吞吐量.
其他文献
霍伊特·汉普希尔  美国西伊利诺大学(Western Illinois University)教授,  教学设计与技术(Instructional Design and Technology)系主任。  在美国实施BYOD的中小学校尽管有很多,但都还处于比较初级的阶段,对于BYOD所面临的一些挑战与困难仍缺乏比较成熟的应对方案。但与中国不一样的是,美国采纳BYOD的中小学校在学段分布上并没有十分明
期刊
市场经济水平的快速提高,为我国建筑行业的发展提供了比较充分的资金保障,使得建筑行业得到了飞速发展.钢筋混凝土在建筑施工中的应用,较好的提升了建筑物各方面的质量,但是
自改革开放以来,我国的经济水平以及科技水平均得到了迅猛的发展.信息化的社会悄然来临.在这样的发展背景下,我国城市化建设的脚步不断加快,建筑行业因此而崛起.在整个建筑工
期刊
病媒生物防治主要包括环境防治、物理防治、化学防治和生物防治等措施。随着杀虫剂和施药器械的发展,化学防治仍是病媒生物综合治理中不可或缺的重要手段。滞留喷洒作为一种
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
为了准确计算船舶运动参数,以提高航海模拟器的模拟精度,本文基于欧拉理论建立船舶运动干扰力和力矩数学模型,考虑了水流压力、水力矩、风压力、风力矩、螺旋桨推力、螺旋桨
基于Hilbert-Huang变换(HHT)能分解出信号的任何频率成份和线性调频(LFM)信号的瞬时频率是关于时间的直线的特性,对频率相近的平行多分量LFM信号进行HHT变换,再利用滤波和改进的最小二乘直线拟合,最后得到各分量较为准确的瞬时参数估计。该方法不需要改变HHT算法本身,而是利用滤波方法和进一步的最小二乘直线拟合抑制了HHT固有的边界效应对瞬时参数估计的影响,提高了频率提取的准确性,而且
期刊
道路“白改黑”,是指在原水泥混凝土路面上加铺沥青混凝土面层,使原来的混凝土刚性路面变为沥青柔性路面.沥青加铺层能有效地改善旧水泥混凝土路面的路用性能,提高道路服务水