基于属性分类的多敏感属性数据隐私保护方法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:ym_l
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术特别是互联网和数据库技术的快速发展,使各组织机构产生了海量的实际应用数据。这些数据的收集和共享有利于提高服务质量、促进科学研究;然而,在这些包含个人信息的数据使用过程中如进行数据挖掘等,也会增加个人隐私信息泄漏的风险。因此,如何在发布个人数据的同时不泄露数据中包含的隐私信息已经成为了一个普遍的问题。隐私保护要确保攻击者不能以高概率推测目标个体的敏感信息。在数据发布的过程中,为了不泄露个体数据中包含的敏感信息,发布数据通常是经过处理后的匿名数据。另一方面,数据发布的最终目的是为了进行数据分析和研究,因此必须保证匿名数据的可用性。所以,在数据发布的隐私保护研究中,重点就是要平衡隐私保护与匿名数据可用性之间的矛盾。在实际应用中,要发布的数据往往含有多个敏感属性,而已经提出的隐私保护方法并不适合多敏感属性的数据发布问题。面向多敏感属性数据发布中的隐私保护方法主要是通过改变敏感属性之间的对应关系使得攻击者不能准确推测目标个体的敏感信息。目前,面向多敏感属性数据的隐私保护算法大多是对k-anonymity和l-diversity算法的扩展,但都还存在一些问题,如在高维数据中隐私信息保护难度较大、信息隐匿率过高等,尤其是当各个敏感属性的值多样性差异较大的情况下这些问题更为突出。针对这些问题及实际应用情况,本文提出了基于敏感属性分类的多敏感属性隐私保护模型。其核心思想是依据各个敏感属性的属性值的多样性程度把属性分类,对不同类的属性设置不同的l值,并依据某种策略进行分组使其满足l-diversity。同时,提出了两种实现该模型的算法,它们采用不同的策略实现数据集的分组并满足该模型的隐私保护要求。实验验证表明,它可以降低信息隐匿率、较好的保护隐私信息,同时提高数据的可用性。
其他文献
在人类认识世界的过程中,人们会不断地接受新的知识,随即人们的认知状态也会发生改变,有时人们遇到的某些新知识会与原来的知识发生矛盾,这时就要对已有的知识库进行更新。如
传统的学习算法都是批量学习算法,即假设一次性获得所有样本,或者获得有代表性的样本,然后用其对分类器进行训练。但在实际的生活中,要一次性获得所有样本,或者获得有代表性的样本
学位
进化算法(EAs,EvolutionaryAlgorithms)由于其具有隐并行性及强鲁棒性等特性,被广泛应用于解决单/多目标优化问题。但在进化过程中,进化算法需要对候选解进行大量的目标函数值评
带宽是互联网通信中的关键因素与重要资源,在互联网规模和网络使用者的日益增多、业务种类逐渐多样化的今天,为了能够获得更好的网络运行环境,网络运营商需要提供更加可靠的
如今已步入云计算时代,云环境下的数据访问离不开数据库的支持,一个性能优良的数据库系统可以极大地提升云平台数据访问速度。目前很多云平台使用的数据库都是集群形式,这主要有以下原因。首先,数据库集群往往都实现负了载均衡的功能。其次,因为集群中包含了不止一个数据节点,大大提高了数据的安全性。此外,当集群中某个节点无法继续执行任务时,可以将该任务分给其他的节点去执行,实现失败转移。可以看出,数据库集群具备了
学位
随着语义网技术的不断发展与成熟,资源描述框架RDF (Resource Description Framework)被应用于越来越多的领域中,然而随着全球全面进入信息化,数据爆炸式的增长,大规模RDF数
随着计算机技术、控制技术和网络技术的蓬勃发展,嵌入式系统与网络控制系统的应用越来越广阔。当前控制系统正经历一场前所未有的变革,远程监控和智能控制成为控制系统发展的重
国际交流日益紧密,单语种语音环境已经不能满足需求,在一台智能设备上集成多种语言的语音环境成为趋势。嵌入式设备存储容量有限,多语种语音数据占用存储空间十分庞大。同语种内
多源图像融合是指提取并综合两个或多个多源图像信息,获得对同一场景或者目标更为准确、全面和可靠的图像,使之更加适合于人眼感知或者计算机的后续处理。多源图像融合在很多领