基于数据集动态更新的隐私保护算法

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:yya_ch
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着互联网等各种各样通讯技术的飞速发展,使信息共享变得越来越容易。国家、企业及个人可以更加容易的搜集到自己所需的有用信息。与此同时随着数据挖掘以及数据发布的应用,隐私保护问题也越来越受到社会各界的关注。以往大多数研究都集中对静态数据集进行隐私保护方法研究,然而在实际应用中,通常发布的数据集都是随着时间变化的,因此如何对此类问题实现隐私保护是一个研究的重点。本文着重对具有内部敏感属性值更新的数据集隐私保护问题进行了研究,为了对具有这种更新类型的数据集进行隐私保护,本文引入了匿名化技术、桶技术,并在此基础之上提出λ-variety算法:首先,采用读取数据表的敏感属性字段类型的方法来判断属性值的更新类型;其次,对于不同类别的数据集更新,采用不同的桶创建和记录分配方法。最后,划分好等价类并进行匿名发布。此外,本文着重考虑了匿名化后数据的准确度这个因素,又提出了(D,λ)-variety算法,(D,λ)-variety算法采用了贪婪思想,其在对待发布数据集实现隐私保护的同时还保证了发布数据集的可用性。本文采用了来自于http://ipums.org网站的Income数据集和OCC数据集进行了实验,结果表明本文提出的λ-variety算法和(D,λ)-variety算法,能对具有外部更新以及具有不同类别内部属性值更新的数据集实现较好的隐私保护。另外,本文提出的(D,λ)-variety算法和本文提出的λ-variety算法相比,前者可以保证匿名化后数据集的准确度,但是前者较后者隐私保护度会有一些下降。所以,在对待发布数据集进行隐私保护时,具体采用λ-variety算法还是(D,λ)-variety算法,可以依据具体的应用目标而定。
其他文献
[摘 要] 现代信息技术的发展对教学领域的影响越来越深刻,现代信息技术融于课堂教学,改革传统教学模式和方法以适应新的教学环境,有利于实现教育现代化。本文首先介绍了三个基本理论,包括多元智能理论、建构主义理论、情境认知理论;然后介绍了现代信息技术条件下课堂教学方式的特点,对现代信息技术条件下高校如何开展课堂教学改革进行了详细的描述;最后提出信息化教学过程中可能存在的问题和解决措施。本文为教师在现代信
随着遥感技术、计算机技术的不断发展,遥感技术已经在众多行业得到了非常广泛的应用。但与此同时,遥感影像分辨率不断提高给数据存储、可视化等方面带来了巨大压力,遥感影像
在许多网络中,网络的拓扑结构是不断变化的,网络中节点之间的关系也会随之发生改变,因此网络的链路预测受到人们越来越多的关注,链路预测也成为了复杂网络中的一个新兴的研究方向
分类问题一直以来都是人工智能领域的核心问题,随着文本内容的丰富,文本的语义呈现出多角度、多标签的特征,为了自动化地索引和管理这些内容,多标签文本分类问题变得重要起来
随着教育信息化迅速发展,“翻转课堂”应运而生.“翻转课堂”改变了传统教学过程中的知识传授和知识内化,具有重要的研究价值.以《翻转的课堂,智慧的教师:高校外语课堂中的自
由于无线网络具有拓扑结构动态变化、带宽资源有限、信道状态多变等特点,传统的TCP协议在无线网络中的性能严重下降。为了解决这一问题,众多学者提出了各种不同的改进方案,如
句法分析(SyntacticParsing)是自然语言处理的一个关键技术,其基本任务是确定句子的成分。因为句法分析需要结合复杂的句法结构,所以该领域一直是自然语言处理的一个难点且发
雾是由于空气中漂浮的水汽凝结而造成能见度降低的一种大气现像。在雾天条件下,因为能见度的下降,从而导致室外图像采集系统获得的图像的清晰度下降,致使图像退化而变得模糊,这极
用户较少配合情况下的虹膜识别技术具有易于市场推广、方便快捷等优点,已成为虹膜识别技术的发展趋势。由于眼睑遮挡、运动模糊、高亮点等多种干扰和噪声影响,非理想条件下采集
基于脑电的脑—机接口(Brain-Computer Interface, BC1)技术作为一种新型人机交互手段,近年来已经成为康复工程以及生物医学工程等领域的研究热点。脑一机接口是在人脑和外界