论文部分内容阅读
基于位置的社交网络(Location Based Social Network,LBSN),由于信息传播速度快,给商家提供了良好的广告平台。位置推广算法可以帮助商家在LBSN上寻找种子用户,并借助他们的影响力宣传商家,从而帮助商家用最少的广告成本换来最大的广告收益。位置推广可以看作是LBSN中的影响力最大化问题。其中,有两个关键点:如何从大量的网络数据中提取有价值的信息来准确度量用户间的信息传播概率;如何设计高效准确的选种算法选择种子用户。针对第一个关键点,现有研究缺乏对用户间的相互影响等多种因素的挖掘,降低了传播概率的准确性,从而影响了选择种子用户的准确率。针对第二个关键点,现有研究主要采用启发式算法或贪心算法。相比启发式算法,贪心算法选择的种子的传播范围更大,然而其时间复杂度也更高,不适用于大规模网络。因此,如何准确度量LBSN网络中用户间的信息传播概率以及如何设计高效准确的选种算法值得进一步研究。为了准确度量传播概率,本文结合LBSN中的用户签到信息、社交关系信息、位置信息等多维信息度量用户间的传播概率,提出了一种基于位置社交网络的多特征独立级联模型(Multi-Feature Independent Cascade Model,MFICM)。该模型提高了用户间信息传播概率度量的准确率,从而提高传播模型度量用户传播范围的准确率。考虑到种子用户具有的一些特定属性,如高访问概率和高传播欲望,本文提出了一种融合用户兴趣的两阶段位置推广算法(Two-stage Location Promotion algorithm combining with User Interest,TLPUI)。将选种过程分为两阶段,第一阶段对LBSN中的用户进行提前剪枝,筛选出候选种子用户,以缩小选种范围;第二阶段结合贪心算法和MFICM传播模型选择最终的种子用户,从而通过两阶段选种降低选种算法的时间复杂度,提高选种的准确性。利用提供丰富语义信息的LBSN——yelp数据集,本文首先使用传播范围、准确率、覆盖率三个指标对MFICM传播模型进行评估。实验结果表明,综合了用户兴趣、用户间相似度和传播者影响力的MFICM的传播范围更大,同时对用户传播范围的评估更加准确。然后,本文对提出的位置推广算法进行了实验验证,从传播范围、准确率、覆盖率以及时间复杂度四个指标对算法的效果进行了评估。实验结果表明,虽然TLPUI在传播范围和覆盖率上稍低于NewGreedy贪心算法,但是大大降低了算法的时间复杂度,同时有效提高了所选种子的准确性。