论文部分内容阅读
随着云计算技术的高速发展,云存储的应用也日益广泛,越来越多的企业和个人选择将数据存储到云存储系统上。云存储在被用户广泛接受的同时,云存储中的数据完整性验证、数据去重技术一直都是学术和企业界关注的焦点问题。数据的完整性是云存储服务对用户最基本的服务保证,同时,为了节省存储空间和提高处理数据的效率,云存储服务提供商亟待于设计出一种高效的数据去重方案。本文以云存储中的数据完整性验证和数据去重技术为研究目标,对云存储中的数据完整性验证方法和云存储中数据去重技术进行了详细的研究和深入的探索。保证用户的数据完整性是对云存储系统最基本的要求,为了给用户提供数据存储和使用的完整性保障,需要对数据在传输和使用过程中进行完整性验证。本文以基于Hadoop分布式文件存储系统(HDFS)搭建的云存储系统为研究载体,对云存储中的数据完整性验证机制进行探索与研究,提出了一种基于RSA并结合同态验证技术的数据完整性验证方法。该数据完整性验证方法的计算拥有更小的时间复杂度、支持动态更改的数据完整性验证、支持公开验证,并且可防止泄露被验证的数据。然后,对本文提出来的数据完整性验证方法的可行性与鲁棒性给予了证明。随着用户的数据量的增长,需要更大的存储空间来存储用户日益剧增的数据;云存储系统中数据量在不断地增长的同时,处理数据所需的时间也随着增长。因此对云存储中的数据去重是一个非常必要的手段。对云存储中的数据进行去重,不仅能够提高云存储的空间利用率,而且可以提高数据处理的效率。本文针对云存储数据分布的特点,从数据指纹索引优化的角度来研究,提出了一种基于相似性的数据块级去重方法。该数据去重方法利用文件特征指纹和数据块指纹构建两级索引,可以极大地提高指纹索引效率。并且,该数据去重方法可以在多个用户的同类文件之间进行数据块去重,在很大程度上提高了存储空间的利用率和对数据的处理效率。最后,本文从数据去重率、系统吞吐率和内存占用率三个方面来进行实验,实验结果表明本文提出的数据去重方法表现出优异的性能。