论文部分内容阅读
在现代的市场领域中,企业或公司经常需要推广他们的新产品、新服务等,社会网络的迅速发展使得它成为企业或公司的重要推广媒介。在利用这个媒介推广产品时,如何利用有限的资金和资源找到那些影响力较大的用户来免费体验产品,通过“口碑效应”和“病毒式营销”的推广方式使得新产品的影响达到最大化,这是社会网络中的影响最大化问题的应用背景。Domingos和Richardson首次将影响最大化问题引入社会网络领域后,很快成为社会网络领域的一个研究热点。科学家们构建了很多的传播模型来模拟影响在社会网络中的传播过程,进而设计算法来解决这一问题。Kempe等提出了独立级联模型和线性阈值模型最为典型,他们还依据提出的模型设计了爬山贪婪算法来解决影响最大化问题,爬山贪婪算法在解决这个问题时可以得到1-1/e的近似最优传播效果,是第一个可以得到稳定解的影响最大化算法,因此很有代表性。 本文首先介绍影响传播最大化的相关理论知识,其中重点介绍独立级联模型和线性阈值模型,其次详细研究了Kempe等提出的爬山贪婪算法并且重点分析这个算法在解决大规模网络中影响最大化问题时的局限性,在此基础上针对线性阈值模型,结合爬山贪婪算法的思想和网络的拓扑结构,提出了一种基于局部网络结构的贪心算法(Local Network Greedy Algorithm);最后在较大规模的真实网络数据和人工网络数据上进行了相关的实验,实验主要从时间复杂度和影响传播效果两个方面比较了本文提出的算法和Kempe等提出的爬山贪婪算法,实验结果证明基于局部网络结构的贪心算法较Kempe等提出的爬山贪婪算法时间复杂度降低了约2个数量级,而影响传播效果约为Kempe等提出的爬山贪婪算法的1.1倍;从而验证了基于局部网络结构的贪心算法的正确性和有效性。