基于聚类的数据匿名发布技术研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:edwinandwolf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术与网络技术的飞速发展,数据库中存放的有用数据大量增加,如何从海量数据中提取出有决策价值的信息,数据挖掘成为一个很好的数据分析工具采用数据挖掘工具可以帮助我们从大量数据中提取出有用的信息数据挖掘需要数据持有者将所拥有的数据进行发布,这就导致了用户隐私信息泄露的问题针对如何保护用户的敏感信息在数据发布过程中不被泄露的问题,目前已提出很多隐私保护数据发布技术,如k-匿名模型(a, k)-匿名模型和l-多样性模型等-多样性模型采用了对数据进行传统的基于层次结构的泛化方案,该模型在对数据集中敏感属性信息进行匿名保护的同时会导致较大的数据信息损失本文针对如何减少发布数据信息损失的问题进行了研究,提出一种基于密度聚类的-多样性数据匿名保护方法,该方法将满足-多样性条件作为聚类的约束问题进行分析,在满足-多样性模型约束的条件下,采用基于密度的聚类算法对数据集中的元组进行划分,针对不同数据类型的准标识符采用不同的泛化技术,并根据数据泛化前后属性的不确定程度来对泛化后的信息损失进行度量通过实验证明了本文提出的方法能够较好的保护对象的敏感信息,并在一定程度上降低了数据泛化带来的信息损失
其他文献
指纹识别技术是利用指纹的某些特征对其主体进行识别和确认的技术,相对于其他生物识别技术,指纹识别的研究最深入,应用最广泛,发展最成熟。但是就目前已有指纹识别算法来说,它们对
随着我国综合国力的不断提升和国际深海领域的竞争的日益激烈,突破第二岛链、走向深海已成为我国面对全球化发展的必然选择。抛弃式温度、盐度、深度(XCTD)剖面仪具有快速、实
随着SAR成像系统的不断发展,成像需求也在不断提高,现在要求SAR系统同时具备高分辨和宽条幅(High Resolution Wide Swath,HRWS)的成像能力。而传统的单通道SAR不能同时满足这
作为计算机视觉领域中最为重要的局部特征之一,图像特征点奠定了诸多视觉任务的基石。图像特征点具备的各种优异性质如旋转不变性,尺度不变性等使其广泛地应用于各种视觉应用
随着科技的进步,软件已深入人类生活的各个层面。在人们享受着软件带来的快捷高效的好处时,软件质量引发的系统故障也越来越多。软件的可靠性在任何系统或者产品的质量因素中都
随着核方法理论的完善以及它在实际生活中的广泛应用,人们对核方法的发展越来越寄予厚望。最主要的是核方法不仅能够应用在统计模式识别的特征向量表示上,也能够很好地应用在结
ZigBee技术凭借其在成本、功耗、速率等方面的特点在无线传感器网络领域得到广泛应用。然而,在实际应用中,因ZigBee网络节点移动或网络拓扑变化会导致较为严重的数据传输故障。
竹片缺陷检测是挑选合格竹片的重要环节。当前竹片缺陷检测仍普遍采用人工检测法,效率低下。考虑到人工劳动力成本的上升,引入机器视觉检测系统甚至是更为低成本的嵌入式机器视
分布式多舰载地波超视距雷达(DMS-SWR)是利用海上编队多艘军舰并存的自然装备资源而构造的一种分布式移动舰载地波超视距雷达系统。这种系统不仅能够弥补单载舰地波OTH雷达所
应用层组播由端系统主机来实现数据转发等组播功能,在分布式多媒体通信领域具有广阔的前景,相对于IP组播来说,具有简单、灵活和易部署性的优点。但是应用层组播的终端主机可