论文部分内容阅读
随着计算机数据处理能力的不断提高,以及存储技术和互联网技术等技术的高速发展,国家信息化建设得到了很大发展。数据是信息的基础,所以数据共享是信息化进程中关键的重要的一步。民航系统和火车票系统实名制的顺利实施,就离不开户籍系统和它们的部分数据共享。数据共享已经给国家和企业以及个人带来了很乐观的效益,但随之而来的隐私泄露问题也是不容忽视的。隐私泄露给数据拥有者带来了共享数据的恐慌,在一定程度上影响了国家信息化建设的进程。因此,怎样在数据共享中保护用户的隐私数据有着重要的理论意义和现实意义。这方面的研究也已经成为数据库和数据挖掘领域比较热门的研究领域之-本文首先阐述了隐私保护技术,然后研究了共享数据为原始数据集的情况下怎样保护敏感数据,接着探究了共享内容为数据挖掘所得的频繁模式的情况下,怎样对敏感信息进行保护。进行的主要的工作有:(1)对数据共享中的隐私保护问题进行了深入的学习和研究,并重点对通过数据净化达到隐私保护目的的方法进行了深入研究。对数据净化的原理和过程进行了总结和阐述。(2)对共享数据为原始数据集的情况下的敏感信息的保护问题进行了研究,并基于数据净化的思想,提出了基于弱敏感模式树的数据净化算法。设计实验对所提出的算法Dpur和已有算法SWA在净化效果上进行了对比试验,并对结果进行了分析。(3)针对共享的数据是经数据挖掘得到的频繁模式的情况,进行了敏感模式保护的研究。从隐藏敏感模式的存在性入手,结合模式净化的思想,提出了基于敏感项的模式净化算法。并设计实验对算法进行了有效性和效率性的试验验证,分析了实验结果。