论文部分内容阅读
近年来,随着互联网及其相关技术的快速发展,诸如Twitter、Facebook等的大批在线社交网络应运而生。在线社交网络为人们提供了一个在线社交关系构建与维护的平台,并在此基础上为人们提供了信息获取、自我展示与思想交流的重要渠道。其中Twitter以其内容简洁、信息发布方式简单多样、信息实时高效、交互度强等特点迅速崛起并越来越受到用户的青睐。庞大的用户群体和信息扩散传播的特点使得在线社交网络成为病毒式营销的绝佳平台,在线社交网络中的影响传播问题也逐渐受到学者们的广泛研究和关注。其中,影响最大化问题通过分析信息在网络中的传播特征与模式,挖掘在线社交网络中最具影响力的用户群体,在理论和实践方面都有着重要的研究价值。本文旨在传统影响最大化问题的基础上,融合用户间交互的主题和时间特征,建立基于主题分布的动态影响传播模型,并在此基础上深入挖掘限定时间内网络中用户节点的影响力。从用户间影响传播的时间和主题特征出发,研究信息在社交网络上的传播规律,最终挖掘限定时间内最具影响力的用户节点集合。首先,以通过Twitter开放API获取的在线社交网络信息为基础,在传统独立级联传播模型的基础上,通过融合用户的在线时间特征、用户间信息传播的主题特征及传播时延等特征,建立基于主题分布的动态影响传播模型。其次,针对上述动态影响传播模型,提取在线社交网络信息中的各维特征,综合考虑用户间的影响概率和信息的传播时延,挖掘信息在社交网络中的传播规律,建立用户节点影响力估算模型。最后,挖掘限定时间内最具影响力的种子集合。根据影响力在社交网络中的传播规律与衰减规律,设计贪心和启发式两算法进行种子集合的挖掘。另外,设计影响力评估算法,对算法有效性和运行效率进行评估。实验表明,在本文建立的动态影响传播模型下,本文提出的算法均能有效挖掘出限定时间内最具影响力的种子集合,并且具有较高的运行效率。最后,设计并实现基于主题的限时影响力最大化原型系统。