数据垂直分布的隐私保护数据挖掘算法研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:ASGSXX1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络、通信技术的迅猛发展,数据挖掘呈现出海量化、分布式等特点,如何保护数据挖掘过程中的隐私数据和防止敏感信息的泄露已成为数据挖掘和信息安全领域当前面临的重大挑战,隐私保护的数据挖掘(Privacy Preserving Data Mining,PPDM)也已经成为数据挖掘(DM)领域的一个重要研究课题。聚类挖掘和关联规则挖掘是应用较为广泛的数据挖掘方法。本文针对垂直分布环境下聚类挖掘和关联规则挖掘的隐私保护方法进行研究,目的是在有效地挖掘出数据库中隐藏的知识的同时保护数据的隐私。本文从敏感知识的保护和敏感数据的保护两方面,介绍了数据挖掘中的常用隐私保护技术;在阐述了数据挖掘技术的基础上,重点介绍了聚类挖掘和关联规则挖掘的原理和流行算法,并分析了各种算法的优缺点。在此基础上,针对数据垂直分布的聚类挖掘和关联规则挖掘中的敏感知识的保护进一步做了以下工作:(1)对于聚类挖掘的隐私保护,设计了一种新的基于数据垂直分布的隐私保护的聚类算法VPPDK(Vertically Partitioned Data Oriented Privacy Preserving Distributed K-means),该算法在数据垂直分布的条件下,将数据干扰和安全多方计算相结合,利用半可信第三方参与下的安全求平均值协议,实现了隐私保护的聚类挖掘,不仅能达到保护数据隐私安全的要求,而且能得到有效的挖掘结果。(2)对于关联规则挖掘的隐私保护,设计了一种新的针对关联规则挖掘的基于密码学技术的隐私保护策略CRYPPARM(Cryptology Based Strategy for Privacy PreservingAssociation Rule Mining)。在CRYPPARM中,采用了安全两方点积协议和公钥密码体系来对垂直分布的数据进行有效的挖掘。同时还引入了局部拓扑结构来尽可能地降低通信成本。(3)对文中设计的相关算法做了测试实验,实验结果表明这些算法具有较好的挖掘准确性、隐私保护性和效率。
其他文献
随着计算机信息技术的飞速发展,传统的纸张文字已无法满足人们对信息的要求,将纸张文字通过各种扫描设备输入到计算机中,即将传统的纸张文字转化为数字化信息已成为时代的必然趋
社交SNS、新闻等领域的高速发展使得人们愈发的关注在最快的时间内获取实效数据,从中挖掘到有价值的信息,实时搜索因此成为目前信息检索的研究重点。通用搜索引擎拥有海量网
随着多媒体技术的发展和信息化时代的到来,各种各样的图像信息也得到迅速增长,纸质形式的文本图像不再是人们生活工作的主要部分,电子版形式的文本图像已广泛运用于各行各业中。
随着微电子与计算机技术的日益成熟,智能手机正朝着高性能、低功耗的方向发展。与此同时,相应的配套软件更是发展迅速。目前,谷歌的Android系统正以惊人的速度占领着手机市场,并
近年来,在航运中泄漏到海洋与内河河流中的数万吨石油对周边环境造成了极其严重的污染。在海上溢油监测技术领域,国内外已取得了瞩目的成绩。然而,内河流域因其水文环境复杂,
处理器的工艺尺寸逐渐缩小,芯片的集成程度越来越高,处理器的可靠性研究需求趋于急迫。针对软错误对处理器可靠性的影响,需对设计出的处理器进行软错误测试。然而,由于此项测试时
随着移动技术的进步,移动P2P游戏作为新兴的移动应用正逐步进入人们的视线,并呈现出越来越强大的生命力。移动P2P游戏面向小规模移动P2P网络,将移动游戏由传统的单机模式改变为
随着网络技术的不断发展和进步,语义网已被大多数人期许为未来网络的模式。各种语义信息技术的成熟和完善,更是进一步推动了语义网络的发展。同时人们对智能化系统的需求也在
在延迟容忍网络DTN(Delay Tolerant Network)中,节点依靠彼此间的间断或机会性连接进行通信。由于传播时延巨大,而且端到端的连接路径并不一定存在,DTN中的数据传输方式与因特网相
近年来,网络游戏产业高速发展,游戏玩家数量在不断的增加,面对如此庞大数量的玩家,单纯的对服务器硬件进行升级已经不足以满足需求。所以一个优秀的网络游戏服务端架构就显得