论文部分内容阅读
随着社交网络的快速发展,这些海量异构数据也带来了隐私泄露威胁。在社交网络中由于结点和边的类别具有多元特点,其可视为一个复杂的异构信息网络。相应的,面向异构信息网络的隐私保护是亟待解决的且具有社会意义和商业价值。本课题针对这一问题展开研究。传统的隐私保护方法假设网络数据相互独立,而当数据具有多属性和强相关性时,现有的隐私保护方法无法起到保护作用。主要研究包括:第一、针对大规模的异构网络,课题首先定义网络中存在的三种相关性:边与边、结点与结点、路径与路径,而后给出三种相关性的计算方法。第二、针对传统差分隐私机制不能处理具有耦合相关性的数据,本文设计了面向相关性的差分隐私保护机制。并且证明了该机制符合差分隐私保护定义,能够最大限度的保护敏感信息不被泄漏。第三、针对异构信息网络结构复杂、信息多样,本文采用了三个图数据中常用的查询函数:度分布、割集、最短路径长,针对这三种查询函数,本文分别研究面向相关性的拉普拉斯噪声添加方法,引入相关性系数干预评价指标的敏感度计算,从而获得对应的拉普拉斯噪声。第四、在以上基础上,本文提出新型隐私保护方法该方法不仅考虑了结点自身对全局的影响,还能考虑与结点相关的其他结点、边对全局的影响,从而对全局的数据起到相应的保护效果。通过对比实验,本文分析了不同方法对含有相关性的异构网络数据的保护效果,控制相关性系数、隐私控制参数等来验证相关性差分隐私机制的效果。同时,实验结果还显示相关性差分隐私保护机制相比传统方法和交互式方法具有更强的保护效果,保护敏感信息不被泄漏的同时具有良好的可用性。