基于数据去重的备份系统中垃圾数据回收技术的研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:gouridzmhuiyouren
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在信息存储技术领域,使用数据去重技术的备份系统中的垃圾回收一直是人们关注的焦点。在备份系统中,一般会为备份数据设置一个保留时间,过时的数据会被回收。但是在对数据去重之后,重复的数据块只保留一份,每个数据块很可能被同一个备份数据流版本内部的数据引用多次,也有可能被多个备份数据流版本之间的数据引用多次。这种同一个数据块的多次引用增加了过期数据块的回收难度,如何高效的清除这些无效数据块,使其所占用的存储空间得以重新利用,是应用数据去重技术的备份存储系统中亟待解决的问题。现有的基于数据去重的备份系统中垃圾数据的回收方法主要包括两种,引用计数(RC)和标记回收(MS)。引用计数的主要思想是为每一个去重系统中的数据块设置一个引用计数值,每次引用到该数据块将对其引用计数值加1,通过检查该引用计数值是否为0即可判断该数据块是否为垃圾数据块。标记回收方法与引用计数不同,它没有设置引用计数值,不在备份阶段对数据进行任何预处理,而是在垃圾回收阶段通过扫描所有的备份元数据来寻找没有被引用的垃圾数据块。这两种垃圾数据回收方法的缺点都很明显。对于引用计数方法,其主要的缺点是可靠性低,任何对引用计数值的重复更新或延迟更新都将导致该数值不正确,使系统中的所存储/引用的数据块与该计数值不一致,导致垃圾数据回收出错。而对于标记回收,其最主要缺点是备份数据的扫描时间太长,标记垃圾数据的速度太慢。针对现有引用计数和标记回收方法的缺点,本文提出了基于引用时间图的垃圾回收机制(Gc_RTM)。该机制以存储容器为单位,构建针对每个存储容器的引用时间图(RTM)和容器位表(CBT),结合引用时间图和容器位表结构快速获取可以回收的垃圾数据块和可以重新利用的存储空间。与引用计数相比,该机制采用了引用时间图,不需要对引用计数值进行简单的加/减1操作,可靠性更高;而与标记回收相比,该方法通过存储容器的引用时间图和容器位表能快速标记要回收的垃圾数据,不需要对备份数据流进行全盘扫描,垃圾数据回收的速度更快。本文采用大量的测试数据集对基于Gc_RTM的垃圾回收方法进行了性能分析和评估。测试结果表明,与引用计数和标记回收相比,该方法无论在垃圾回收的时间性能开销还是空间性能开销表现都要更好。在单个版本回收中,Gc_RTM的时间性能表现相对于RC约有20倍的提升,相对于MS约有100倍的提升,且随着备份版本的增加,性能表现更好。在批量版本回收中,Gc_RTM性能表现要更好。在空间开销表现方面,Gc_RTM开销最小,约为RC的1/2,MS的1/3,且随着备份版本增加,优势更加明显。总的来说,Gc_RTM能够有效的提升使用数据去重技术的备份系统中的垃圾回收的时间和空间性能表现,优化了存储性能。
其他文献
自动增益控制(Automatic Gain Control,AGC)是无线接收机拓展动态范围的一个重要途径,它可以保证输入功率变化很大时,使输出功率稳定在较小的范围。AGC电路广泛应用于各种无线接收机、硬盘读取、雷达以及医疗设备等。本文对无线接收机射频前端的AGC电路进行了研究,论文完成的主要工作可概括为:(1)设计了一款两级低噪声放大器和一款MMIC放大器。两级低噪放采用ATF54143晶体管,
本文重点对新艺术风格在陶瓷装饰中的应用进行了广泛的研究,通过图片及相关资料的分析,汲取了新艺术风格与中国传统纹饰各自的表现特征,以归纳并探讨两种风格之间的联系。在这次的毕业设计创作中,图案设计上将对花卉纹样进行提炼重构,在形式美法则的基础上,以新艺术风格和中式风格结合的方式重现。技法上将结合运用刻线,釉上彩,釉下彩,颜色釉等不同陶瓷装饰手法进行展现。同时,主题以“自然”为元素作为主线贯穿始终,借此
肥胖是一个全球性的健康问题,主要与人们生活方式的紊乱与缺乏身体运动有关。肥胖与大量慢性疾病和残疾有关,如高血压、血脂异常、胰岛素抵抗、糖尿病和癌症等。胰脂肪酶是抗肥胖药物的一个重要靶点,它是脂肪消化过程中将脂肪水解成甘油和游离脂肪酸的关键酶,抑制胰脂肪酶是抗肥胖药物发现的重要方法之一。皂角是豆科皂荚属植物皂荚(Gleditsia sinensis Lam.)的干燥成熟果实,主要含有皂苷、黄酮、酚酸
<正>中国人口的快速老龄化、大规模老龄化以及"未富先老",使得关注、完善老年群体社会保障服务成为民生保障的重要内容。在整体经济水平还不够发达的情况下寻找合适的退休人
为了帮助弱势学生群体顺利升入大学,增加他们接受高等教育的机会,美国联邦政府制定了一系列专门针对这类学生群体的大学预备计划,并取得了显著的成效。其中备受关注且得到普
为正确百有效地进行砂岩酸化设计和酸化效果预测,砂岩土酸酸化数学模型的建立和完善十分重要,。本文通过模型评,指出Hill毛车管模型和Hekim分布参数模型是迄今从微观和宏观角度提出的两种