论文部分内容阅读
随着社交网站、博客、微博等网络应用的流行,各种各样的在线社交网络产生了。在社交网络中,用户既是信息的接受者,也是信息的制造者和传播者。这就为社交网络中信息的高速传播创造了条件。现在,社交网络已经成为一个巨大的信息传播平台,使得信息可以在短时间内影响很多的人。为了充分发挥社交网络作为信息传播平台的效用,社交网络面临两个挑战,即社会影响传播模型和影响最大化。前者是对社会影响在社交网络中的传播过程建模,后者则给出了在大规模社交网络中有效寻找最具影响力的节点的方法。本文以在线社交网络的应用为背景,针对社交网络传播模型和影响最大化开展的研究工作。首先,对社交网络的社区发现问题进行研究,基于社交网络中信息传播的局部性,提出了一种基于信息传播的社区发现算法DC_ID。该算法分为局部社区发现与局部社区合并两个阶段。在局部社区发现过程中,首先估算网络中各个节点的影响力,然后选取影响力较大的节点作为局部社区的核心,按照传播路径,逐层扩展,从而发现以其为核心的局部社区。在局部社区合并阶段,本文用组合熵估计两个局部社区的亲密度。当两个局部社区的组合熵高于某个提前设定的合并阈值时,该算法将两个社区合并在一起,从而发现整个网络的社区结构。其次,对于社交网络影响最大化算法效率较低的问题,基于社交网络的社区结构,提出了一种影响最大化算法CGINA。把社交网络中的信息传播看作各个社区之间的合作博弈,根据各个社区在信息传播博弈中的Shapley值,确定各个社区待发现的种子节点数。然后,在各个社区中挖掘指定数目的种子节点。再次,对基于节点信息偏好的影响最大化问题进行研究,基于网络中的节点对于不同主题信息的不同偏好,提出了一种基于信息主题偏好的2阶段影响节点挖掘算法L_GAUP。第一阶段,基于用户对于特定主题的偏好值,便可以得到对于待传播信息主题的易感染节点网络;与其他节点相比,易感染节点网络中的节点具有更高的偏好值。第二阶段,本算法利用贪心策略在易感染节点网络中挖掘影响节点。然后,考虑到负面影响在网络中传播的情况,将负面影响传播集成到经典的线性阈值模型中,提出一种集成负面影响传播的线性阈值模型的扩展模型LTN,并对该模型下影响函数的单调性和子模性给出相应证明。基于这些性质,提出了一种近似因子为1-1/e的贪心算法和三种改进的算法LTN_New Greedy、LTN_CELF和LTN_Mixed Greedy。最后,基于竞争性的信息传播模型COICM(Campaign-Oblivious Independent Cascade Model,COICM),研究了该模型下的影响抑制最大化问题。为提高算法的效率,基于信息传播的局部性,提出了一种基于社区结构的CB_IBM算法。