基于差分隐私和安全多方计算的模型融合隐私保护数据挖掘方案

来源 :内蒙古大学 | 被引量 : 1次 | 上传用户:wufj77
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的普及和大数据时代的来临,网络中产生和传输的数据量呈现井喷式增长。很多数据往往涉及到用户隐私,包含用户不愿泄漏的信息,然而已有的数据挖掘方案很容易导致这些信息的泄漏。所以,人们希望在保护隐私的条件下进行数据挖掘,也就是在尽量保护用户敏感信息的同时挖掘出准确的结果。隐私保护数据挖掘算法多年来致力于平衡保护隐私和保持挖掘准确性两者之间的关系,但往往顾此失彼。不同的应用场景往往要求在数据挖掘算法中加入不同的隐私保护方案。而且,现今的数据挖掘场景更加复杂,越来越多的机构或个人更愿意在不损害自身敏感信息安全性的前提下,多方一起共享挖掘。因此,保护各方的数据安全并且提供准确有价值的挖掘结果就显得尤为重要。本文的隐私保护工作主要针对当前流行的数据挖掘分类模型:贝叶斯网络。首先在各参与方进行局部结构学习后计算各结点对互信息和条件互信息的值,接着加入Laplace噪声后基于安全多方计算进行求和,根据求和结果得到数学期望。然后基于模型融合的思想,在全局学习时以得到的期望作为评价标准来构建最终的贝叶斯网络结构。在融合结构学习过程中只计算了样本集中各变量间的互信息和条件互信息的值,而不直接使用局部参与方的样本信息。采用差分隐私机制通过对局部数据进行加噪处理使敏感属性失真的方法保护信息的安全;采用安全多方计算在计算互信息和条件互信息的期望值时保证求和时的数据安全,所以能够保证在结构学习时的数据安全性。最后,基于已有数据样本进行参数学习得到完整的贝叶斯网络。本文的算法可以在保护用户隐私的提前下提供有效的参数学习和预测结果,实验结果表明:相比于同领域的其他方案,本文设计的方案可以在有效地保护各方敏感信息下得到正确的分类结果。
其他文献
在全球气候变暖的压力下,减少温室气体排放受到了世界各国的重视。节能减排已成为当前各国政府的重要任务,各国政府积极制定政策限制企业碳排放,其中碳排放权交易制度是目前
Lactobacillus helveticus H9是一株分离自西藏传统酸牦牛奶的优良益生菌株,其发酵乳具有ACE抑制活性和降血压活性。本文研究目的是为探究L.helveticus H9对发酵乳贮藏稳定性
目的叶酸受体在鳞状细胞癌中有高表达,通过构建可以靶向定位的纳米级金属聚合物探针,再与阿霉素(DOX)、秋水仙碱(COLC)有效地加载在这种材料中(FA-GCGLD-DOX/COLC),分别在体
光声成像(Photoacoustic Imaging,PAI)是近年来兴起的一种典型的生物医学成像技术,其结合了纯光学成像的高对比度和超声成像探测深度好的优点,与计算机断层扫描成像(Computed
随着电子器件集成度的不断提高,尺寸持续减小,界面所占比例越来越大,有效地进行热管理是提高器件效率的重要途径之一。因此对材料的热传输性质的研究显得尤为重要,尤其是薄膜
研究表明大鼠骨髓间充质干细胞(MSCs)有益于脊髓损伤(SCI)后的功能恢复,本研究利用基因编辑技术构建人热休克蛋白启动子的真核表达载体hHsp70-ND2,并探讨了不同诱导时间对小
内切木聚糖酶和β-木糖苷酶都是非常重要的糖苷水解酶,它们在食品、饲料、造纸、纺织、能源等方面都具有重要的应用价值。耐盐酶在高盐浓度下仍然有催化活性和稳定性,可应用
Banach空间中的凸分析理论有着极其精妙的性质和作用,这些凸分析的理论推动着Banach空间几何理论的快速和深层次的发展.到目前为止,Banach空间中的凸性研究已有了极大的进步
随着新一代移动通信技术的变革和发展,评判系统性能的关键指标将更加多元化,比如更加注重用户体验、平均吞吐量、用户传输时延以及对网络新型业务的支持能力,为优化以上指标,
随着太赫兹技术的发展,可以吸收太赫兹波的器件开始不断地涌现。但现有的太赫兹吸收器由于尺寸过大和电磁性质有所局限,导致其出现吸收频率单一、调谐深度比较小的问题,所以