论文部分内容阅读
随着大数据时代的到来,作为云计算中最重要的服务之一的云存储极大地方便了用户将数据外包到云端进行存储,并共享给授权的用户。随着外包数据的爆炸式增长,重复数据删除技术(又称为“数据去重”)因其能够消除冗余的数据来节省存储空间以及相应的管理开销在云存储中得到了广泛地研究。然而,由于用户不会完全信任云服务提供商,因此考虑到外包数据的安全性和隐私问题,用户很可能会在外包数据之前使用自己的私钥加密数据。传统的加密技术会阻碍数据去重技术的发展,尤其是对于用户间数据去重来说,原因在于相同的数据会被不同用户的密钥加密成随机密文。对于这些随机密文,数据去重技术主要面临着两个方面的挑战:一方面是云服务提供商很难识别不同的密文是否对应于相同的明文;另一方面,如何高效地保证拥有相同数据的用户能够解密存储的唯一密文。因此,如何有效的在加密数据上执行数据去重操作成为了一个亟待解决的问题。为了解决这个问题,我们对密文域上的数据去重进行了深入的研究,并提出了三种有效的安全数据去重方案。首先,我们研究了一种两级的跨域(两个区域)数据去重架构,并提出了一个高效的安全数据去重方案。该方案可以抵抗来自云服务提供商发起的离线暴力攻击,并且高效地保证了拥有相同数据的用户能够解密存储的唯一密文。此外,该方案还考虑了相等性信息(即,两个不同的密文是否对应于同一个明文的信息)的保护。虽然在安全数据去重中无法完全防止相等性信息的泄露,但是巧妙地利用合数阶双线性配对技术来保证只有云服务提供商能够检查两个域中用户上传的数据之间的重复性,从而最小化该信息的泄露。理论分析和实验结果表明该方案在计算、通信和存储效率上优于现有的相关方案。此外,该方案能够将重复数据搜索的时间复杂度从线性级别降低到对数级别。其次,当域的数量大于两个时,同时解决上述数据去重中的两个挑战就变得十分困难。虽然一些现有的方案尝试克服此困难,但是它们以牺牲效率为代价,从而违背了实际应用的效率要求。为此,我们提出了一种应用于多个域(n个域)的高效安全数据去重方案。通过为每个数据生成一个随机标签和恒定数量的密文,该方案不仅实现了语义安全性,还解决了数据去重在密文域上面临的两个挑战。此外,通过限制只有代理和云服务提供商能分别检查同一个域中用户上传的数据之间的重复性和不同域中用户上传的数据之间的重复性,该方案最大程度地降低了相等性信息的泄露。此外,该方案还实现了数据完整性的验证。理论分析和仿真结果表明了该方案的效率明显优于现有的相关方案,尤其是在计算开销和重复搜索的时间复杂度方面。最后,考虑到云存储中的访问控制需求,我们提出了一种支持用户自定义访问控制的高效安全数据去重方案。通过让云服务提供商代表数据拥有者授权数据访问,该方案能够在不影响云用户隐私的前提下最大限度地消除重复性。此外,该方案还能实现标签一致性验证,以抵抗由恶意用户发起的重复伪造攻击,该攻击是安全数据去重中的一种特殊攻击。详细的安全性分析表明该方案能够同时实现数据机密性、标签一致性、访问控制以及抵抗暴力攻击。仿真分析证明所提出的方案在计算、通信和存储效率方面,以及去重效果上均优于现有的授权安全数据去重方案。