基于关键词的外包数据安全检索技术研究

来源 :南京信息工程大学 | 被引量 : 0次 | 上传用户:richard8517742
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
云计算因其强大的计算功能,被越来越多的用户(企业和个人)使用。云存储也因此应运而生。用户通过将本地数据上传到云端,无需担心存储大量数据所需要的基建设施等本地消耗。但是,当数据被外包到云服务器之后,数据拥有者和云都可以对这些数据进行相关操作,容易出现内部人员盗用等安全问题。同时,第三方的攻击致使数据被隐蔽读取甚至是恶意篡改,使得数据安全及用户隐私得不到安全保障。为了应对这些安全隐患,常常需要将外包的数据进行安全加密。但加密方案存在看似两个矛盾的目标。其一,加密应必须满足其强大的安全算法,从而保持对云服务器的隐藏。其二,方案需在计算成本和存储成本可接受的情况下,满足用户的日常检索需求。这两个矛盾的目标致使传统的明文检索的技术失效。因此加密检索方案应运而生。通过对加密检索进行研究,实现安全存储数据的同时,达到数据高效利用的目的。现有基于关键词的密文检索方案已有很多。这些方案能支持不同的检索需求,包括单关键词及多关键词检索、排序检索、模糊检索,语义检索等。这些开创性的工作使得加密云数据检索的研究越来越深入,但现有的方案中主要通过添加随机数实现查询不相关,达到用户隐私保护的效果。这些随机的词的存在,虽然防止了云服务器的统计分析,但也降低了检索的精度。另一方面,现有基于关键字的检索方案中,检索的关键词主要是依据字典生成。字典的长度直接影响向量的维数。当数据集较大的情况下,匹配计算的时间也较长。同时,依据字典生成的0-1向量并不能很好的反应语义信息。基于以上两点,本文分别设计了基于混淆关键词的外包数据安全检索方案和基于Word2vec的外包数据安全检索方案。两方案的具体工作如下:(1)提出了一个基于混淆关键词的外包数据安全检索方案。在该方案中,基于用户历史检索数据,可以有选择地实现混淆关键字的选择和嵌入。与在其他方案中生成的向量末尾添加随机值不同,本文设计了混淆关键词的选择算法,并在向量生成前进行嵌入,从而真正实现“随机”效果,达到保护用户隐私的目的。为了消除混淆关键字匹配导致的无关文档,提出了一种基于混淆关键字的二次检索改进方案。通过构造两个不同陷门,进行两次筛选,确保数据的准确性。实验证明了这两种方案的有效性。(2)提出了一个基于Word2vec的外包数据安全检索方案。在该方案中,结合机器学习Word2vec对原有方案进行改进。通过Word2vec训练方法建立语义模型,本方案将把从数据文档中提取的关键词生成低维语义向量,而不是根据字典长度生成的传统的0-1长向量。随后,将已经加密的数据外包给公共云。云服务器将根据搜索请求按照相似性分数的顺序返回文档。实验表明,它基于有效数据具有更高的效率。
其他文献
煤矿充填材料的性能是充填采煤技术的关键。充填采煤法对充填材料在工作特性、力学特性、变形性能及泵送性能(液态)等方面提出了诸多要求。而现有的研究成果及现场应用表明,
盐碱胁迫是严重影响植物生长,限制产量和区域分布的重要因素之一。盐碱胁迫会引起植物水分缺失,破坏渗透平衡和氧化平衡,导致叶片气孔导度降低,抑制光合作用,对植物的光能利
气象变化与人类生活是密切相关的,如果不能掌握气象变化,人类就无法在这个“蔚蓝色的星球”上生活。台风、洪水、沙尘暴等气象状况与人类的生活密切相关。因此,这就更需要用
船闸口门区是决定船舶是否能安全驶过引航道的关键部位。为保证船舶的过闸安全,我国相关行业规范规定闸址一般应选在顺直、稳定的河段,船闸口门区一般也位于顺直段,且相应地
随着经济形势的下行和供需关系的转变,国内传统能源企业的生存环境愈加艰难,产能出现过剩,许多企业纷纷转型,开始进入新的领域。但在进入新领域的同时,势必会因为行业壁垒而给企业经营带来风险,这些风险又会影响企业的生存发展。作为本文的研究对象,永泰能源从单一的煤炭企业转变为电力、煤炭、石化为主营的综合型能源企业,再逐步进入物流、能源、生殖医疗等产业,其实施的一系列战略转型却给企业增加了风险,所以加强企业的
学位
白腐真菌以其强大的重金属吸附能力,在重金属废水治理研究中得到了深入研究。微生物体表面的胞外聚合物是其抵御重金属毒性的一道重要屏障,通过螯合、固定等方法改变重金属的
煤矿开采工艺和技术的不断改进促进了特厚煤层的高效开采。大采高技术一次可采煤层厚度达7m,特厚煤层综放开采技术实现了厚度超过20m煤层的开采。同煤塔山煤岩层受煌斑岩侵入
现实生活中冒犯事件不可避免,而人际宽恕可以缓解冲突、化解矛盾,有利于构建和谐的人际关系。宽恕感是指原谅别人且心安的情感,属于人际情感的一部分。全国调查研究发现,大学生宽恕感得分在人际情感中排名倒数第一,说明中国大学生宽恕感总体水平相对较低,亟待提高。从受害者视角出发,感恩感和宽恕感的正相关已经得到了理论层面的支持,特质感恩感得分高的大学生其特质宽恕感得分也较高,但这一结论主要基于问卷调查,缺少实证
互联网时代数据的爆炸增长,使得用户难以负担本地存储的巨大成本,因此越来越多的用户选择将数据外包给云服务器。然而数据的外包也使得云服务器能获得用户的敏感数据。因此为了防止用户数据遭到泄露,必须将敏感数据加密上传给云服务器,但是复杂的加密技术也使得传统的明文检索技术失效,因此可搜索加密成为了当今的热点问题。传统的可搜索加密技术大部分都是选取关键字作为文档的特征,虽然近年来基于关键字密文检索方案日趋完善
电力工业的发展水平是一个国家经济发达程度的重要标志,在国民经济中占有十分重要的地位。改革开放以来,随着我国经济的快速发展,电力投资增长迅猛,这给继电保护产业带来了前