论文部分内容阅读
近些年来,随着互联网和通信技术的不断变革与发展,现实生活中处处存在着各种各样的复杂网络,复杂网络的相关研究也得到了各领域学者的高度关注。社区结构作为复杂网络中普遍存在的重要特性,对深入探究复杂网络的结构和性质有着重要的意义。检测复杂网络中的社区,可以挖掘网络中的潜在群体,揭示真实网络背后群体的潜在规律或者关联,在现代商业应用中具有较高的实际应用价值,并已广泛应用于推荐和检索等领域。目前,社区发现的相关算法有很多,但这类算法普遍存在着时间复杂度高、准确率低等缺陷。标签传播算法作为一种社区发现算法,具有时间复杂度低,无需任何先验条件,适合在大规模网络中进行社区发现而受到广泛关注。然而,标签传播算法存在随机性高、稳定性低的缺陷。针对上述缺陷,本文对现有标签传播算法进行了改进,在一定程度上提高了标签传播算法的稳定性和精确度。(1)针对原始算法在节点初始化时未考虑到节点差异性的问题,本文提出一种基于核心节点逐层扩展的标签传播算法。从节点初始化方面进行优化并给出新的标签传播方法。首先,引入Leader Rank算法计算节点影响力,其次以节点影响力为基准,筛选出核心节点作为初始标签传播源,减少标签传播中不必要的判断开销。最后,采用逐层更新的方式更新节点标签。实验结果表明,该算法虽然时间复杂度较高,但能够稳定有效地检测社区。(2)针对原始算法在节点更新顺序以及节点标签存在随机性的问题,本文提出一种基于节点影响力的标签传播算法。引入k-shell算法,在此基础上结合节点度数给出新的影响力计算方法,按照节点影响力大小固定节点的更新顺序,避免资源的“逆流”。节点标签更新时考虑邻域节点对待更新节点的局部影响力,从而使得选取的标签更加准确。实验结果表明,该算法能够稳定高效地检测社区,并且时间效率接近原始算法,适用于大规模网络。基于上述算法,本文设计并实现了一个微博用户兴趣社区划分系统,本系统最主要的两个功能是用户影响力分析和用户兴趣社区划分。通过爬取微博用户数据进行实验测试,实验结果表明本系统能够精确地划分用户兴趣社区。