论文部分内容阅读
随着云存储服务的普及,越来越多的数据存储在云服务器中。而实际上,云存储服务器中的数据大部分都是冗余的,尤其是图像、视频这种占用内存较多的多媒体文件。为了节约存储空间资源、网络带宽和数据管理成本,基于客户端的重复数据删除技术得到了广泛的应用。基于客户端的重复数据删除技术针对图像类型而言(简称“图像去重”)主要包括重复图像检测和所有权证明(Proof of ownership,PoW)两部分。重复图像检测是通过映射函数将图像映射为简短的摘要,并进行匹配的过程。“所有权证明”概念是为了保证用户数据的安全性而提出的,云服务器通过所有权证明协议来判断客户端是否真的拥有完整的原图像。然而由于数字媒体在应用方式上的推陈出新,客户端重复数据删除技术在图像等多媒体重复数据删除应用中正面临新的挑战。本文首先研究了现有的重复数据删除方案,并总结出现有方案主要存在以下不足:(1)由于语义鸿沟的存在,图像的相似性匹配尚无法做到完全精确,从而导致图像重复数据删除率大幅下降或者图像非重复数据被错误删除。(2)目前,对于交叉客户端图像重复数据删除的所有权证明还处于起步阶段,研究者曾经提出通过随机辅助图像进行所有权证明的方案,但该方案中仍然存在浪费服务器存储空间资源和网络带宽的缺陷。针对上述不足,为了实现安全、准确的交叉客户端图像重复数据删除,本文重点对图像重复数据检测过程中的精确性问题和图像重复数据删除过程中的安全问题进行了大量研究,并取得如下成果:(1)为了解决图像重复数据检测精确度低的问题,本文提出了一种基于感知的图像重复数据删除方案。一方面,该方案通过感知哈希算法提取图像特征避免了传统的重复数据删除技术只能检测编码完全相同的图像而导致图像重复数据删除率过低的问题。另一方面,该方案通过两种感知哈希算法从不同方面提取图像特征,从而对图像进行双重检测,减小了单一图像特征缺乏足够图像信息而导致的图像非重复数据被错误删除的概率。最后,实验仿真结果表明,通过设置合适的阈值,该方案与现有方案相比,在减小了非重复数据被错误删除概率的情况下,依然能够保证较高的图像重复数据删除率。(2)为了解决图像重复数据删除过程中的安全问题,本文提出了一种基于置乱的图像所有权证明方案。该方案通过云服务器发送的询问信息,利用原图像本身生成所有权证据,不需要借助于辅助图像,因此节省了云服务器的存储空间资源和网络带宽,通过安全性证明和仿真实验结果可以得到,该方案不仅能节省网络带宽和云服务器的存储空间资源,还在计算时间开销方面有非常明显的优势。