自多数据流闭合共生模式挖掘的差分隐私保护方法研究

来源 :广西师范大学 | 被引量 : 0次 | 上传用户:dande
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在数据流上进行频繁模式挖掘是数据挖掘领域的一个研究热点,然而很多方法研究的是单数据流,其中每条事务是独立的,不考虑某些事务由相同个体产生。在现实生活中,许多应用涉及到多数据流,每个用户对应于一条数据流,令人感兴趣的对象往往是最近发生并且出现在许多数据流中,如新兴主题发现、网上购物分析、Web使用模式挖掘和基于位置的服务等。对多数据流进行研究与共享可以极大的推动社会的发展,因为这些数据通常包含了当前的热点数据,政府可以利用这些统计结果进行民生调控与经济规划,或者用于科学研究,商业公司可以用这些统计数据进行商业推广与商业开发。但是这些数据往往也包含个人信息,如果未经任何处理就直接发布统计数据便会造成个人隐私泄露。差分隐私是一种有效的隐私保护技术,它具有严格的数学定义,且不需要假定攻击者的背景知识,已广泛应用于各种数据发布场景。基于差分隐私的频繁模式挖掘是数据挖掘和数据安全领域交叉的研究热点,然而已有的频繁模式差分隐私方法主要针对静态数据集,并且存在的数据流差分隐私方法主要针对数值或分类值数据,尚未有研究考虑多数据流上共生模式挖掘造成的隐私泄露问题。本文分析多数据流中单一窗口和连续窗口发布闭合共生模式带来的隐私泄露问题。为了解决这些问题,提出多数据流闭合共生模式挖掘的差分隐私保护方法。本文的主要研究工作如下:1)对数据流频繁模式挖掘、静态数据差分隐私频繁模式挖掘和数据流上差分隐私数据发布方法进行了综述和分析,讨论现有的工作不能直接应用于多数据流闭合共生模式的挖掘,并指出本文方法与现有方法的不同。2)讨论多数据流闭合共生模式挖掘方法在单个窗口和连续窗口发布top-k闭合共生模式存在的隐私泄露问题,指出连续时间戳发布闭合共生模式增强了攻击者的推理能力,仅需少量的背景知识就能推测出用户的隐私,因此连续窗口发布更容易泄露用户的隐私。3)提出多数据流top-k闭合共生模式挖掘的差分隐私保护方法DP-TCPM(Differentially Privacy Top-k Closed Co-Occurrence Patterns Mining Algorithm),该方法包含差异计算阶段和差分隐私挖掘阶段。差异计算阶段将上一次已加噪的闭合共生模式与当前待发布的真实统计数据进行对比,根据对比结果判断是否进入差分隐私挖掘阶段。差分隐私挖掘阶段包括通过事务分割调整共生模式图、利用指数机制扰动共生模式图、top-k闭合共生模式挖掘和对挖掘出的模式支持度进行加噪四个部分。同时对算法的时间复杂度进行分析,并证明算法满足差分隐私。4)在三个真实数据集(OnlineRetail、BMSWebView2和Foodmart)上进行大量的测试。由于缺乏直接对比的方法,本文提出一种完全扰动共生模式图的差分隐私保护方法FPCG(Differential Privacy Method Based on Fully Perturbation for Edges in CP-Graph)。选择F-score、平均相对误差和运行时间三个指标对提出的算法进行评估,实验结果表明本文的方法具有较好的效用性和有效性。
其他文献
“学习雷锋好榜样,忠于革命忠于党……”这首创作于1963年的歌曲,歌颂的便是伟大的共产主义战士、中国人民解放军全心全意为人民服务的楷模——雷锋。  雷锋,原名雷正兴,湖南望城人。1940年,他出生于一个贫苦农民家庭,7岁时不幸成为孤儿。新中国成立后,雷锋积极参加了儿童团,思想愈发进步;与此同时,在新旧社会的强烈对比下,他的革命信念也愈发坚定。  1956年夏,小学毕业后的雷锋参加了工作,先是在乡政
信息监控是移动电站控制系统中一个重要的环节,对移动电站信息的准确监控对整个电站控制系统有着重要的意义。本课题正是基于移动电站的信息监控而提出的,系统以PIC16F877A为
智能电网的稳定运行离不开电气设备的状态检修,而对电气设备进行在线监测是进行状态检修的基础,通过传感器网络对电气设备进行在线监测存在高压侧传感器取电难的问题。为满足
《孟子注疏》在南宋時被立於學官,後收入《十三經注疏》中,流傳至今,影響深遠。第一章關於《孟子注疏解經》的版本述論,搜羅宋、元、明、清共八個版本,考察各版本的版式、卷數、刊刻、遞修、流傳等情況,並分析版本性質,說明校勘價值。第二章關於《孟子注疏解經》前四卷的校勘札記,以東京大學東洋文化研究所所藏的明嘉靖李元陽本為底本,匯校宋八行本、元十行本、監本、毛本、殿本、阮本,參考《孟子音義》和前賢校勘記,整理
近年来“黑广播”的现象日益猖獗,引起国家有关部门和领导的高度重视。全国31个省(区、市)无线电管理机构与公安、广电、民航等部门协同配合,启用大量无线电监测定位设备、监
三维头发建模在影视娱乐、3D游戏等应用中起着不可或缺的作用。目前主要有两类常见的头发建模方法:用专业的三维模型设计软件进行人工交互编辑以及基于图像的建模方法。人工
配电网是电力系统中不可缺少的组成部分,是电力系统中输电与用电的桥梁,对我们的日常生活与工作有着非常重要的影响。配电网重构是电力系统网络优化运行的关键技术之一,是配
随着计算机工业以及人工智能的迅速发展,人机交互技术作为其中不可或缺的一部分,受到越来越多人们的关注。在众多人机交互的手段中,手势交互是最高效、自然、舒适的一种交互
工业磨抛机器人对工件进行打磨时,打磨接触力是打磨质量与效率的重要影响因素之一,不稳定的接触力是损伤工件使工件不达标的主要原因之一。本文改进了基于单一位置参数的机器
切换正系统是混杂系统的一种,在公共交通、生物学、通讯网络等领域有着广泛的应用。但因为此类系统同时拥有正性和切换特性,且这两种特性相互耦合,所以对切换正系统的分析有