论文部分内容阅读
随着近些年来互联网的快速发展,人们使用网络的成本越来越低,如今已经进入人人皆是网民的时代。人们通过互联网上的各种渠道发布和获取信息,而在线社交网络成为最重要的渠道之一。随着越来越多身份背景各异的用户加入其中,问题也随之出现:社交网络上的隐私泄露愈发的频繁和严重,数据的泄露和滥用所引发的安全事件层出不穷。更加令人担忧的是由于这些安全事件是在用户个人层面的隐私问题,所造成的后果通常是微小且影响深远的,因此并未得到用户本身以及研究人员的重视。但层出不穷的隐私泄露事件证明了社交网络中的个人隐私保护存在巨大的漏洞,这些信息的泄露可能不会直接对用户造成危害,但会带来后续如网络诈骗、身份伪造、垃圾广告投放等恶意行为。同时社交网络中节点数量庞大,节点之间互动频繁等特点为隐私保护造成了巨大的困难,现有的部分研究也存在计算步骤繁琐,效率低下等问题。而相关领域如物联网、云存储网络中的隐私保护方案也并不适用于社交网络。因此亟待提出一种针对社交网络这个特定场景中的个人隐私保护方法解决上述难题,隐私度量应运而生。在深入分析在线社交网络的特点、分析现有研究方法不足之处的基础上,本文提出了新的隐私度量方法,研究内容如下:1.现有的社交网络种类繁多且用途各异,它们建立的背景以及隐私保护方法各有不同,用户可能根据自己的需求同时使用多个社交网络,现有方法无法满足隐私保护需求,因此本文提出了一种适用于多个社交网络平台下对用户个人隐私状况进行度量的方法。该方法针对用户在每个社交网络上填写在个人资料中的属性信息进行量化,包括传统方法中已有的可获取度、提取难度、可靠性等指标并对它们进行了改进,另外创新性地提出了新的指标—隐私意识,然后融合这些指标得到属性的可见度。最后结合改进后的属性敏感度得到用户在多个社交网络上的隐私度量值,从用户这个根源上解决隐私泄露问题。2.社交网络中的同质性是指链接关系越紧密的节点,其特征越相似,这种特性促使研究者不得不放弃仅从个人的角度去量化用户的隐私状态,而需要从用户与周围好友的关系中考虑隐私泄露:用户周围的好友关系越多,网络结构越复杂,通过分析这些好友的隐私信息,推断出目标用户隐私信息的可能性就越大。但是分析这些好友面临着一个巨大的难题:由于社交网络同时符合小世界特性,即任何人都能在六跳之内互相到达对方,这导致了目标用户周围的用户数量十分庞大,以至使用现有算法效率极低且效果较差。本文经过调研发现,在这些庞大数量的好友中,真正对目标用户的隐私泄露有影响的好友仅占其中一小部分,其他大部分都是冗余用户。针对这个发现,本文提出了一种改进算法用以得到用户与任意好友之间的结构相似度,对结构相似度进行排序后,排除排名靠后的部分用户,即与目标用户隐私泄露相关性较低的好友,然后结合之前的个人隐私度量方法,对用户在整个网络图结构中的隐私状态进行度量。这是首次提出应该将研究方向转向考虑相关用户与目标用户的关系紧密程度,而不是仅仅扩大所考虑的相关用户的范围和数量。3.在上述研究中,本文发现使用结构相似度对冗余用户进行筛选的同时,出现了信息时效性缺失的问题,即得到的相关用户与目标用户的关系在时间上存在延时性。这些相关用户可能在目标用户所处上一个环境中与其关系亲密,而现阶段随着目标用户的环境改变,他们掌握的相关信息已经失去隐私效用。因为随着环境的改变,个人属性信息也随之改变,而部分脱离这个环境的其他用户并未掌握这些新的信息,即信息失去了时效性,泄露这些信息对目标用户的隐私状态毫无影响,这是现有研究尚未考虑到的问题。为了解决这个问题,本文创新性的加入了目标用户与周围好友的行为特征并提出行为亲密度的概念,结合上一部分提出的结构相似度,得到与目标用户现阶段隐私泄露密切相关的好友并进行隐私度量计算。这是首个将信息的时效性加入到隐私度量的研究,为之后的研究提供了新的思路。4.在传统的隐私度量研究领域,研究者对影响用户隐私泄露的各项特征进行量化,最终将这些特征融合得到一个整体的度量值。在这个过程中,不但需要对数量繁多的特征进行人工选择,也忽视了这些特征之间隐藏的关系。同时,传统方法在对整个网络进行分析之后,往往只能得到目标用户一个人的隐私度量值,效率十分低下。因此本文提出了一种通过深度学习模型结合现有特征的隐私度量框架。该框架可以有效地提取出各项特征之间的隐藏关系,摆脱繁琐的特征选择和计算步骤。这是首次将深度神经网络引入到的隐私度量领域中的研究,为之后的研究扩展了新的方向,并解决了传统方法效率低下的问题。以上研究成果在深入分析现有隐私度量领域成果的基础上,针对社交网络中用户基数大、成分驳杂、网络结构复杂的情况,提出了针对多社交网络平台下的隐私度量方法、针对用户所处网络环境中的隐私度量方法、结合用户行为特征的隐私度量方法以及使用深度学习模型的隐私度量框架,这些成果对于在社交网络中用户的隐私保护具有一定的理论意义和实际价值。