论文部分内容阅读
在社交网络的研究中,链路预测已经成为一个非常重要的研究方向。链路预测是利用网络中已有的拓扑结构来预测网络中目前没有联系的节点之间产生联系的可能性。在社交网络中,链路预测不仅可以对网络中缺失的链路进行预测,还可以对未来可能产生的链路进行预测,因此链路预测具有非常重要的理论意义和实际价值。而在众多链路预测算法中,基于相似性的链路预测算法已经成为主流算法,因此本文的研究都是基于相似性的链路预测算法。通过对现有基于相似性链路预测的算法进行分析,并针对目前存在的问题,本文提出了三种新的链路预测算法。目前基于局部拓扑相似性的算法只考虑了节点之间的共同邻居的个数以及共同邻居节点的度。如果两对节点之间有相同的共同邻居个数,并且每个共同邻居节点的度数也对应相等,那么用基于局部拓扑相似性的算法计算这两对节点之间的相似性值是相等的。但是如果这两对节点之间的拓扑结构完全不同,那么它们之间的相似性也是不一样的。因此本文提出一种新的算法,在共同邻居节点的度的基础上考虑了共同邻居节点之间的连边对相似性的影响,同时还考虑了非共同邻居节点之间的连边对相似性的影响。现有的基于局部拓扑的算法只考虑了网络中的局部拓扑信息,忽略了其他社交理论信息,如社团结构、强弱关系等。已有研究者把社团引入到链路预测算法中,但是这些算法是在共同邻居存在的前提下定义的,当两个节点之间没有共同邻居时,这些算法就认为它们之间的相似性为0,所以预测准确性不高。本文提出用社团相关性表示不同社团之间的相似性,并且通过综合考虑局部拓扑信息和社团相关性进行链路预测。当两个节点处于不同社团时,在考虑节点的局部拓扑的基础上,还考虑了节点所属的两个社团之间的相关性,这样就避免出现结果中有太多节点对的相似性为0。目前RALP算法是一种性能比较好的半局部相似性算法,但是该算法没有考虑到节点自身对相似性的贡献。因此本文在RALP算法的基础上考虑了节点自身对相似性的贡献,提出一种新的半局部相似性算法。该算法不仅考虑了不同路径对相似性的影响,而且对相同长度路径上度比较大的中间节点进行惩罚,还考虑了节点自身对相似性的贡献。通过在真实的社交网络数据集上进行实验仿真,证明本文提出的算法整体上比传统的基于相似性的链路预测算法的预测准确性高。