分布式重复数据删除系统中路由方法的研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:zhanggh20060363
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据中心的数据呈指数级增长,为了保障系统的高吞吐率、高重删率和负载平衡,分布式重复数据删除存储系统面临巨大挑战。分布式重复数据删除存储系统主要通过改进路由方法和改善指纹查找的效率来优化系统性能。现有的分布式重复数据删除存储系统,主要采用无状态和有状态的路由方法。其中无状态路由方法,由于不考虑节点已存储数据的历史信息,整体重删率低、存储失衡;而有状态的路由方法,需要将备份数据流的全部指纹在每个节点上查询,系统吞吐率较低。针对以上问题,本文设计并实现了一种结合指纹抽样和减少数据碎片(Fingerprint Sampling and Fragmentation Reduction,FSFR)的路由方法,该方法与已有的路由方法相比,保证了系统的重删率和负载平衡,提高了恢复吞吐率。该方法具体为:首先在客户端对数据进行预处理,将分块数据合并生成超块(Super-Chunk),提取抽样指纹序列;其次在节点服务器端,采用布隆过滤器对指纹进行查找,考虑重删率和存储利用率,初步筛选出部分节点服务器;然后客户端发送超块全部指纹给筛选出的部分节点进行碎片查找;最后,根据碎片查找结果,选择碎片量最少的一个节点作为路由节点进行数据去重。通过真实数据集测试表明,分布式重复数据删除存储系统使用FSFR有状态路由方法,通过选择合适的路由粒度等参数,系统的吞吐率和重删率能达到较高的水平。相比于现有EMC stateful路由方法、Boafft路由方法,该分布式重删存储系统的恢复吞吐率提升了约50%。
其他文献
随着航天、国防、医学等领域的发展以及纳米技术的不断提高,零件的尺寸越来越小,微纳物体的表面参数分析已成为精密测量领域不可或缺的研究方向。2011年科技部启动了国家重大
纳米电子器件和技术是解决传统半导体工艺技术瓶颈的途径之一。共振隧穿二极管(RTD)作为较成熟的纳米电子器件,在高速低功耗的数字电路领域应用广泛。由RTD构成的单双稳态转
随着企业自主创新能力的不断增强,与之相关的R&D信息也日益增多。作为企业的战略性信息之一,R&D信息已然成为资本市场上价值评估的一项重要内容。2006年,财政部颁布的新企业
随着互联网技术的发展,人们已经从PC时代进入了以智能手机为代表的移动互联网联网时代,目前人类每天产生的数据量呈指数在增长。也有人称21世纪是数据的时代(DT)。移动互联网
并行程序在科学计算、金融股票、国防安全等领域应用日益广泛,其执行周期往往以月为单位。为了应对随机错误、蓄意攻击等威胁,并行程序必须具有容错机制以确保其正确运行至结
实际工程系统中的控制输入大部分都属于饱和输入形式,并且是非对称和非光滑的,而且大部分的参数都是不确定的,系统长期运行中也不可避免会出现执行器的故障问题。考虑到大多
近年来,关于不确定非线性系统跟踪问题的研究与应用越来越受人关注。在设计控制器时,假若忽略了非线性系统的不确定因素(可能包括未知参数、外界扰动,测量误差等等),很有可能
该论文是一篇基于译者翻译实践项目的翻译报告,原文文本约11000字。所译文本原标题为RetailNext Advanced Analytics Playbook,是零售商客流分析服务商RetailNext所做的关于
随着移动互联网的发展和Android移动设备的普及,针对Android系统的各种恶意软件也迅速发展和扩散,对用户的隐私和财产安全造成极大的影响。面对数量快速增长的Android恶意软
随着互联网和推荐技术的快速发展,推荐系统逐渐呈现出许多新的特性,这为推荐系统带来了新的挑战。Web服务推荐作为具有智能化特征,以满足潜在用户需求、主动推荐为手段的方法