论文部分内容阅读
近年来,随着以微博为代表的社交网络多媒体平台的蓬勃发展,越来越多的用户自生成内容在社交网络上涌现。这种基于社交网络发布和分享多媒体内容的行为方式成为当代人生活的重要部分。社交网络上的多媒体资源十分宝贵,在舆情分析和政策决策等方面具有重要价值。然而,社交网络的开放性也导致了各种各样的谣言产生和传播,不仅严重损害网络媒体的可信度而且还有可能造成重大的社会危害。如何自动检测网络谣言成为当前研究的热点。 考虑到社交网络多媒体固有的多模态性和互联性的特点,从自动谣言检测涉及的特征表示、特征融合和检测算法这三个关键阶段入手,本文分析了自动谣言检测面临的挑战,展开了针对性的谣言检测技术研究,并取得了以下三个方面的研究成果: 1.基于图像特征的谣言检测 自动化谣言检测的第一步是从丰富的网络内容中抽取有效特征来表征谣言。社交网络上存在着丰富的图像内容,但现有的谣言检测方法还主要集中于对文本内容特征表示。观察到图像在视觉上和统计上都表现一定的区分谣言事件的能力,本文提出一组新的图像特征来提高谣言检测效果。具体而言,本文基于社交网络多媒体平台的特点和谣言检测任务的特点,分别提出了5个图像视觉特征和7个图像统计特征。这些特征从不同的方面刻画了谣言事件中图像的视觉和统计特性。在采集自微博的多媒体数据集上的实验证明了这些图像特征的有效性,证实了图像特征能够很好地与传统的文本等其他特征互补,综合提高谣言检测效果。 2.基于递归神经网络多模态特征融合的谣言检测 社交网络上存在着文本、图像以及社交属性等不同模态的信息,而传统的谣言检测方法采用简单的特征融合方式,无法合理协调不同模态的特征。为了能够充分发挥多模态内容的作用,本文提出一种基于递归神经神经网络的多模态特征融合方法来检测谣言。该方法通过递归神经网络自动学习文本特征同时融合社交属性特征,通过卷积神经网络抽取图像视觉特征,同时引入注意力机制将不同模态的特征融合到一起,形成对谣言消息的多模态特征表示。在采集自微博和Twitter两个多媒体社交平台的数据集上的实验结果显示,本文提出的方法不仅明显优于传统的简单特征融合方法,也优于现有的基于神经网络的特征融合方法,实现了有效的针对多模态内容的谣言检测方法。 3.基于可信度传播的谣言检测 社交网络上的多媒体内容通过各种方式紧密地联系在一起。依靠这种内容的互联性,本文提出两种基于可信度传播的谣言检测方法。两种方法通过充分挖掘谣言事件中存在的不同话题和观点等深层语义,构建内容实体之间的关系,再基于图优化理论设计合理的可信度传播算法,将不同实体的可信度在彼此影响下不断传播,实现更加稳定和全面的谣言检测。其中,基于分层可信度传播的方法,考虑到事件中存在的不同话题,从消息、子事件和事件这三个不同的尺度对谣言事件进行建模,再逐层地进行可信度传播;基于正反向可信度传播的方法,考虑到谣言事件中存在的质疑和反驳信息,通过挖掘事件中的对立观点来建立消息之间的观点支持/反对关系,再基于正反向地关系进行可信度传播。实验结果证明,本文提出的方法相比现有的孤立的分类检测算法更加有效。