论文部分内容阅读
近年来,越来越多的人力物力开始投入到复杂网络的研究当中。链路预测作为复杂网络中一个重要的研究方向,也受到了大量的关注。链路预测就是利用网络现有的信息,通过一定的方法,预测那些网络中未被观测到的边或者在网络演化过程中将来会出现的边。链路预测在生物领域、计算机科学领域、社会科学领域等领域都有着极为广泛的应用,不仅具有实际应用价值,也有重要的理论研究意义。链路预测算法在近些年也取得了不小的成果,各种各样的链路预测算法不断被提出,这些算法主要分成了基于相似性的链路预测算法和基于最大似然的链路预测算法两类。而其中基于相似性的预测算法发展最快,成为了链路预测领域的主流算法,其特点为简单和具有较高的预测精度。另外基于最大似然的预测算法虽然在计算精度和运算复杂度上表现一般,但这些算法可以加深对于网络结构的理解。这些基于相似性算法中的每一个相似性指标都有其优势和劣势。如何最大化地发挥一个指标的优势,同时尽可能避免这个指标的缺点,是本文关注的方向。本文中首先将局部路径指标(Local Path,LP)和偏好连接相似性指标(Preferential Attachment,PA)巧妙地结合起来,得到了一个新的指标。接下来又融合了结构微扰法(Structural Perturbation Method,SPM)和资源分配指标(Resource Allocation,RA),利用其不同的特性,结合得到了表现优异的一个新指标。最后本文提出了一个对网络本身进行优化去噪的算法,可以结合大部分相似性指标,并提高其预测精度。下面是本文主要内容的简要概括:(1)基于PA指标和LP指标的融合互补的链路预测。LP指标指出,节点之间的不同长度的路径对于节点相似性的贡献是不同的,所以考虑所有长度的路径信息是有助于刻画节点相似性,但是为了降低运算复杂度,LP指标丢弃了长度大于某一特定值的路径信息。本文认为节点的度包含节点之间的路径信息,从而引入了基于节点度的PA指标。将两个指标巧妙结合,提出了一个新的相似性指标,通过对不同网络的实验发现,新指标具有较好的预测准确性和鲁棒性。(2)基于SPM算法和RA指标融合的链路预测。SPM算法利用结构扰动之后重构的邻接矩阵预测连边,本文认为重构得到的邻接矩阵比原来的邻接矩阵更接近实际的网络,包含了更多的信息。为了充分利用这些信息,本文引入RA指标对重构之后的邻接矩阵进一步的处理,从而得到了一个新的链路预测指标,在实验中我们发现,新指标不仅有着更好的预测准确性,在鲁棒性上的表现也很优异。(3)基于网络优化去噪的链路预测。现实网络中存在着大量的噪声,为了在链路预测过程中减少噪声的影响,本文利用相似性指标对网络中的已知边进行评价,将低分边当做噪声处理。然后将网络进行去边和加边的优化,将去边过程中得到的预测结果和最终网络的预测结果结合起来作为预测结果。该算法适用于其他的相似性指标,可以有效地提高预测精度。