论文部分内容阅读
当前,人们获取信息的方式愈发多样化,从传统纸媒到新闻APP到现在的社交媒体网络(OSN,online social network)。微博平台正是OSN的一种。随着微博的流行,人们从微博上接触到的资讯却不能得到可信的保障。因为人人都可以成为新闻的源头,人人都可以成为新闻的传播者。同时常有恶意用户为了达到自己的目的,发布或传播一些不实的言论。这些言论会干扰正常用户的判断,从而被人利用。因此,为微博进行可信度评估是一个切实可行的方法,来为用户过滤恶意或者无关的资讯,净化话题广场和用户时间线。本文的研究就是针对微博中的用户和特定话题下的微博内容进行可信度评估。针对微博用户可信度评估的问题,本文提出了基于信任传播的用户可信度评估算法。本文考虑了恶意用户通过建立虚假社交关系来攻击算法和人工选取种子集的高消耗低精度的情况,提出了三种优化策略——基于社交活跃度和相似度的剪枝算法、基于聚类的种子节点选取算法和基于双向信任传播的传播算法。剪枝算法可以修剪掉恶意用户和正常用户建立起的攻击边。种子节点选取算法将聚类算法和人工选取结合,能够半自动地选取出高可用的种子节点集。最后基于双向信任传播的传播算法利用用户社交关系图来双向传播信任评分,使高可信用户拥有高可信评分,反之亦然。最后通过实验验证了基于信任传播的用户可信度评估算法在微博用户可信度评估方面的有效性。针对微博内容可信度评估的问题,本文提出了基于异构网络的微博内容可信度评估算法。算法分为基于相似度的微博可信评分偏差初始化和基于混合传播规则的微博可信度评估两部分。对比验证后的真实新闻报道和恶意舆情给予微博不同的初始可信评分,基于相似度有偏差地初始化微博可信度评分。在混合传播规则的微博可信度评估中,综合考虑了微博内容、用户和上下文关系对于可信评分传播过程的影响,在不同实体之间传播评分,迭代计算微博内容可信评分。最后通过实验验证了基于异构网络的微博内容可信度评估算法能够提供一个高质量的可信微博数据集。