基于双数组Trie树的云数据安全去重技术的研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:dorisnanjin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
云计算中用户重复数据安全去重(Data Security Deduplication,DSD)技术是一种将待上传数据上传到云存储服务器之前对用户数据进行数据是否重复检测,将已在云存储服务器中出现的数据不再上传的技术,既要保证在上传下载过程中的安全,也要保证用户对数据所有权的安全。重复数据的上传,不仅会产生多余的通信开销,还会对云存储服务器的容量产生一定影响。数据安全去重技术主要面临三个挑战:1)重复数据的判断;2)数据安全去重方案的性能;3)数据所有权的认证。面对这三个挑战,研究更细致,更全面,更安全的数据安全去重技术具有十分重要的意义,一方面是可以降低通信开销以及存储成本,另一方面是确保用户的数据安全与隐私保护。本文针对云存储环境下数据安全去重技术和多用户所有权认证技术,主要工作如下:1、分析了云环境下用户数据安全去重技术的研究背景和意义;对其中主要的步骤进行了国内外研究方法的详细分析,阐述了研究云环境下数据安全去重的实际意义,给出了改进的方向。2、介绍了几种常见的数据分块技术,并详细介绍了其优劣,给出了一种数据流行度判断算法和一种最短字节增量数据分块技术,设计了一种两级数据分块方案,通过大量实验数据得到最优数据分块的大小,仿真实验表明其稳定性较好,适合现有的数据去重方案。3、结合BL-MLE算法、数据分块技术,用户所有权验证以及双数组Trie树技术设计了一种基于双数组Trie树的云环境下细粒度数据安全去重方案;通过数据细粒度分块以及检验,实现数据细粒度重复对比;使用BL-MLE算法对数据及数据块进行加密后对比,实现数据安全去重;通过使用双数组Trie树对数据以及用户信息进行存储,实现用户数据的所有权验证;通过综合分析表明方案可以满足功能,安全性和性能的需求。本文的创新之处包括:1、提出了一种云存储环境下数据安全去重方案。该方案中将数据按传播范围不同进行分类,通过不同的数据分块技术对不同传播范围的数据进行分块,并通过BL-MLE方案对分块之后的数据块进行加密重复对比,实现细粒度对比的同时确保其安全性。2、提出了一种对数据先进行流行度判断,在根据不同的流行度对数据采用不同的数据分块方案。可以有效对传播范围不同的数据进行较好的数据分块。3、提出了一种细粒度的所有权验证方案。通过引入双数组Trie树来对数据内容和所有权信息进行存储验证,可以对存在部分重复的数据进行所有权验证,降低对数据所有权的存储开销,同时细粒度的去重也能降低数据的存储开销。
其他文献
由于在划分无标签且含有缺失实例的多视图数据上具备优势,不完整多视图聚类吸引了越来越多的研究关注。虽然已取得很大进展,大多现有不完整多视图聚类方法仍存在至少一个以下缺陷:(1)无法同时开发数据样本之间跨视图的共同关系及原始数据特征表示的互补多视图信息;(2)忽略视图之间高阶的相互关系;(3)只能处理诸如只有两个视图等特殊视图不完整情况。针对这些问题,本文主要开展了以下两方面研究:(1)为了同时挖掘数
互联网给用户带来丰富资源和便捷服务的同时,因其开放性和匿名性,也成为网络攻击的平台。在众多网络安全问题中,恶意网页扮演重要角色。如何实现对恶意网页的精准快速识别,已经成为一项迫切且具有挑战性的工作。目前,识别方法大致分为四类:基于黑名单技术的检测手段、基于启发式规则的检测方法、基于机器学习的检测方法以及基于蜜罐技术的检测手段。但已有方法都有各自的局限性,必须面向恶意网页检测手段进行更深层分析与探讨
随着信息技术的不断发展,网络安全问题层出不穷,网络攻击的方式也变得复杂多样。入侵检测系统具有主动防御的功能,能够对网络流量进行持续监控,提升了系统的安全性。近年来,随着机器学习技术的普及和计算力的大幅提升,大量基于机器学习的技术被应用于网络入侵检测领域,相较于传统的网络安全防御手段,更能适用于当今网络攻击复杂多样化的环境。但在大量的网络数据中入侵行为只占少数,数据分布不均衡,而且原始网络流量存在大
随着大数据时代的到来,图像数据的采集变得越来越简便与多样化。在现实应用场景中,由于采集设备、拍摄角度、目标物遮挡等外部条件是动态变化的,因此采集到的图像数据即使表示的是同一类目标,数据分布也几乎都是不一致的。大多数现有的机器学习算法是基于训练数据和测试数据分布相同的假设进行训练和测试,并不适用于处理在复杂的现实环境采集到的图像数据。作为迁移学习方法的具体应用,交叉领域识别可以有效解决上述问题。交叉
我国通信业正逐步加强网络建设,积极推进网络强国战略,为了落实提速降费,研究网络运维中基站维护是具有重大意义的。截止2019年底,国内部署的通信基站总数量已经超过800万,电信业务收入超过1.31万亿元。本文在分析国内外大量相关文献的基础上,着重展开网络运维中基站维护领域的“现场作业综合调度”优化问题的研究,希望可以提高通信基站的运营维护效率,降低通信基站的维护成本,从而降低通讯资费。通过分析基站维
比特币作为虚拟货币被人们所重视,而区块链作为比特币的底层技术被受到大量人员的关注和研究,凭借数据安全透明、防篡改、点对点传输、去中心化、可溯源等特点,区块链的应用开始层出不穷。区块链的本质也是一种分布式数据库,分布式数据库首先要解决的是多节点如何保证一致性和如何达成共识等问题。共识机制是区块链的灵魂,也是目前的研究热点之一,针对区块链项目应用场景和算法的性能要求的不同,接连出现了众多的共识机制,区
2020年由于新冠疫情的影响,人们避免面对面接触式的购物,这使得自动蔬菜机、自动饮料机等等自动无人售货机更加受到市场青睐。自动售货机市场也迎来了发展的又一次高峰。传统自动售货系统在支付方式、对售货机的状态监控方式等等方面已经落后,对于自动售货机的补货频率和区域补货人员配比问题已经成为行业的难点,该问题直接影响了商家的盈利能力,为解决该问题有必要建立销售量预测模型,根据该模型预测结果提前设计补货频率
在现实系统中,因为受部件影响,执行器总是伴随着死区特性。在生产过程中,执行器的参数也随着工作条件和环境的变化而变化。另外,参数随时间的变化会导致控制系统失衡,严重限制了系统的性能。再者,许多研究并没有考虑实际系统的切换特性。主要原因如下:在切换系统中,有许多不同的切换规则。在一定的保守条件下,没有统一的切换规则来稳定系统,使得系统的稳定性分析非常复杂。其次,由于执行器死区参数的跳变,系统的稳定性不
胼胝体是连接左右脑对应部位的最大纤维束丛,使得大脑在功能上成为一个整体。对于通过电子计算机断层扫描(Computed Tomography,CT)技术重建得到的CT图像,以及通过常规核磁共振成像(Magnetic Resonance Imaging,MRI)技术获取到的MR图像,直接在图像中分割仅能得到胼胝体的大概形状,无法利用分割信息进行胼胝体相关病理分析或实验研究,且难以重建胼胝体中的细微纤维
互联网在迅速发展使得生活变得信息化的同时也带来了很多问题,信息过载问题是当前亟待解决的核心问题之一,对互联网上的海量信息进行降维处理变得越来越有必要,而文本摘要技术便是解决该问题的重要途径之一。深度学习的发展推动了以神经网络方法为主导的文本摘要技术进步,然而当前已有的研究表明传统神经网络在文本较长的情况下会由于依赖过长导致信息丢失,无法对长文本序列进行有效地编码表示。当前主流的文本摘要方法都是基于