数据发布中的轨迹隐私保护方法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:sz_davild
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着GPS和其他移动定位设备及服务的广泛使用,使得收集到的轨迹数据也日益增多。一方面,轨迹数据中含有大量有价值的信息,通过挖掘和分析这些时空轨迹可以帮助支持多种与移动相关的决策;另一方面,每条轨迹中含有的信息都可以被攻击者所利用,以识别用户的敏感信息,比如个人的兴趣爱好、行为模式、生活习惯、健康状况等从而对用户构成不可预测的伤害。因此,在发布时空轨迹数据之前,需要对原始数据进行处理,以防止用户的隐私被重新识别。目前,很多研究者们都针对这一问题展开研究并取得了一定的研究成果,其中轨迹k-匿名的方法是解决这一问题比较常用也是效果比较好的方法。传统的轨迹k-匿名方法是将时间和空间上相近的至少k条轨迹进行匿名,使得匿名后的这k条轨迹不可区分。它是针对轨迹上的所有点进行匿名,这就导致轨迹严重失真,影响数据质量。同时,为了将时空相近的轨迹划分到同一个k-匿名集中,需要对轨迹进行聚类。然而轨迹在时间和空间上的分布很难进行统一,因此需要更加复杂的算法对轨迹进行预处理。另外,轨迹上各个点的隐私需求是不同的,攻击者的背景知识也与轨迹上某些特殊的点有关。因此,针对以上问题,本文提出了数据发布中基于兴趣点的轨迹k-匿名隐私保护方法。该方法主要通过保护轨迹上的兴趣点来达到保护轨迹隐私的目的。很显然,在轨迹匿名之前需要先提取轨迹的兴趣点,根据轨迹隐私需求和研究需要,首先给出了本文中兴趣点的定义。在形成轨迹k-匿名集的过程中,本文避免了复杂的轨迹距离计算,而是根据相近轨迹的特征将时空相近的轨迹划分到一个分组中,即时空相近的轨迹会经过相同的兴趣区域。最后,将同一个k-匿名集中的轨迹进行匿名发布,这里采用了位置交换的思想。轨迹的匿名只是针对轨迹上的兴趣点,而对于普通点将不作任何处理。因此在本文中,轨迹k-匿名是指由兴趣点所构成的轨迹的k-匿名。我们在真实生活中的轨迹数据集上进行了实验,并且通过两种不同的方法对发布后的数据质量进行评估。通过与现有方法进行比较,证明了本文所提出的方法在达到隐私需求的前提下提高了数据质量。
其他文献
自然背景中的文本识别具有巨大的应用价值。但由于场景非常复杂,字符又形态多样,其应用一直受限于定位和分割技术的不足。本文经过大量研究,提出了一种基于学习的自然场景中
随着网络技术的高速发展,人们对网络的传输信息种类和服务质量的要求越来越高。传统的网络管理是一种基于SNMP协议的集中式管理,它采用轮询机制,随着网络规模迅速扩大,它的时
随着计算机和通信技术的发展,无线广域网、无线城域网、无线局域网、卫星通信网、蓝牙网络等多种无线网络系统正逐步代替传统有线网络成为互联网接入的最后一跳。如何将这些
近年来,计算机及其相关技术的迅速发展及图形图像技术的日渐成熟,开创了数字图像处理的新时代,该技术也逐步渗入到医学领域中。借助计算机图像图形学、虚拟现实和计算机网络
互联网中拥有数量庞大的信息资源,而传统的基于网络爬虫的搜索引擎只能检索其中很少的一部分,而且它们不善于检索以动态网页形式存在的信息和存储在网络边缘的信息,但基于对
在竞争环境激烈的今天,越来越多的中型和小型企业认识到客户管理在企业竞争中的重要性。但对于大多数中小企业来说,建立专门客户管理系统需要专门硬件和专业的技术人员,这增加了
随着数字化技术和Internet的飞速发展,数字多媒体信息的传播变得越来越方便,但也带来了版权保护的危机。数字水印作为数字媒体版权保护的一种有效手段,得到了广泛关注,并已经
随着信息技术逐步应用于各行各业,面向领域的软件生产逐渐成为研究和开发重点。零码软件生产平台(SoftproLine)即是针对特定应用领域而开发的柔性软件产品开发平台,其主要应用
Web服务是实现Internet环境中跨平台、跨语言和松散耦合的分布式计算技术,也是面向服务架构中的关键技术之一。Web服务给许多企业带来了商机和快速发展的机会。但是Web服务的
随着云计算和移动互联网等概念越来越深入到普通人的生活当中,大数据也随着变得越来越深入人心。在当今竞争激烈的商业战场上,谁能掌握破解大数据的钥匙,谁就能在商业领域占得先