论文部分内容阅读
负调查是一种新型的敏感信息收集方法,其只需要参与者提供与自身类别不同的类别给收集者,而收集者可以通过特定的统计学方法(称之为重构方法),来从负调查结果中重构出所有参与者的敏感信息分布。由于在负调查中,参与者仅仅提供了和自身类别不同的类别,因此,负调查可以在保护个人敏感信息隐私的前提下,完成敏感信息收集任务。由于操作简单,计算量小等优点,负调查在近年来得到了越来越多的关注。本文针对负调查的重构方法展开了研究,提出了两种新的负调查重构方法。此外,本文还改进了已有的基于负调查的位置信息收集方法,并扩展了负调查的应用领域,将负调查应用于收集评价信息以及时序敏感信息收集之中。具体地,本文的主要研究内容和创新之处总结如下:(1)提出了一种新的负调查重构方法(称之为NStoPS-LP),该重构方法将重构过程转换成一个线性规划问题,并采用内点法来求解所得线性规划问题。在人工数据集上的模拟实验结果表明,相比于已有的重构方法,NStoPS-LP可以更加高效地获得不包含负数的重构结果。此外,本文还通过模拟实验在实际的教育质量评价数据集上验证了 NStoPS-LP的性能。实验结果表明,即使在实际的应用场景下,NStoPS-LP仍然具有较好的表现。(2)提出了一种新的基于负调查的位置信息收集方法来查找人群聚集地,相比于已有的基于负调查的位置信息收集方法,本文所提出的方法能够更好地保护用户的位置隐私,尤其是移动中用户的位置隐私。此外,本文所提方法比已有方法具有更加灵活的隐私性和可用性的控制粒度。在人工数据和实际数据集上的模拟实验结果表明,本文所提出的方法能够较为精确地找到人群聚集地。(3)针对多问题负调查的重构结果,定义了一致性的概念。同时,本文还分析了两种经典负调查重构方法所得重构结果的一致性,即NStoPS和NStoPS-I。此外,本文还提出了一种多问题负调查重构方法(称之为NStoPS-C),该重构方法可以获得一致的,且不包含负数的多问题重构结果。在人工数据集上的实验结果表明,相比于NStoPS和NStoPS-I,NStoPS-C可以获得更合理且更加精确的多问题重构结果。不仅如此,本文还将负调查应用于健康数据的收集之中,并使用NStoPS-C来重构正调查结果。模拟实验结果表明,即使在实际应用场景下,NStoPS-C仍然可以获得比已有方法更加精确的多问题重构结果。(4)将负调查应用到商家/商品信用评价之中,并提出了负评价模型。相比于传统的评价模型,负评价模型可以更好地保护顾客的评分隐私。为了测试负评价模型的实际效果,本文从亚马逊网站上收集了一些商品的实际评分数据,并用这些数据对负评价模型进行了模拟测试。实验结果表明,负评价模型可以有效地保护顾客的评分隐私,且所得信用评分与实际评分较为接近。(5)在收集时序敏感信息时,传统的负调查模型可能会泄漏个人敏感信息隐私。为此,本文提出了一种改进策略,使得负调查在收集时序数据时,仍然可以较好地保护个人敏感信息隐私,并将其应用于用电信息的收集之中。进一步地,本文分析了所提方法在收集用电信息时的安全性,并通过模拟实验,在人工数据集和实际数据集上验证了所提方法的性能。总得来说,本文针对负调查的理论和实际应用展开了研究,对敏感数据收集方法的研究具有参考价值。