社交网络多媒体谣言检测关键技术研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:tiantianle_a
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着以微博为代表的社交网络多媒体平台的蓬勃发展,越来越多的用户自生成内容在社交网络上涌现。这种基于社交网络发布和分享多媒体内容的行为方式成为当代人生活的重要部分。社交网络上的多媒体资源十分宝贵,在舆情分析和政策决策等方面具有重要价值。然而,社交网络的开放性也导致了各种各样的谣言产生和传播,不仅严重损害网络媒体的可信度而且还有可能造成重大的社会危害。如何自动检测网络谣言成为当前研究的热点。  考虑到社交网络多媒体固有的多模态性和互联性的特点,从自动谣言检测涉及的特征表示、特征融合和检测算法这三个关键阶段入手,本文分析了自动谣言检测面临的挑战,展开了针对性的谣言检测技术研究,并取得了以下三个方面的研究成果:  1.基于图像特征的谣言检测  自动化谣言检测的第一步是从丰富的网络内容中抽取有效特征来表征谣言。社交网络上存在着丰富的图像内容,但现有的谣言检测方法还主要集中于对文本内容特征表示。观察到图像在视觉上和统计上都表现一定的区分谣言事件的能力,本文提出一组新的图像特征来提高谣言检测效果。具体而言,本文基于社交网络多媒体平台的特点和谣言检测任务的特点,分别提出了5个图像视觉特征和7个图像统计特征。这些特征从不同的方面刻画了谣言事件中图像的视觉和统计特性。在采集自微博的多媒体数据集上的实验证明了这些图像特征的有效性,证实了图像特征能够很好地与传统的文本等其他特征互补,综合提高谣言检测效果。  2.基于递归神经网络多模态特征融合的谣言检测  社交网络上存在着文本、图像以及社交属性等不同模态的信息,而传统的谣言检测方法采用简单的特征融合方式,无法合理协调不同模态的特征。为了能够充分发挥多模态内容的作用,本文提出一种基于递归神经神经网络的多模态特征融合方法来检测谣言。该方法通过递归神经网络自动学习文本特征同时融合社交属性特征,通过卷积神经网络抽取图像视觉特征,同时引入注意力机制将不同模态的特征融合到一起,形成对谣言消息的多模态特征表示。在采集自微博和Twitter两个多媒体社交平台的数据集上的实验结果显示,本文提出的方法不仅明显优于传统的简单特征融合方法,也优于现有的基于神经网络的特征融合方法,实现了有效的针对多模态内容的谣言检测方法。  3.基于可信度传播的谣言检测  社交网络上的多媒体内容通过各种方式紧密地联系在一起。依靠这种内容的互联性,本文提出两种基于可信度传播的谣言检测方法。两种方法通过充分挖掘谣言事件中存在的不同话题和观点等深层语义,构建内容实体之间的关系,再基于图优化理论设计合理的可信度传播算法,将不同实体的可信度在彼此影响下不断传播,实现更加稳定和全面的谣言检测。其中,基于分层可信度传播的方法,考虑到事件中存在的不同话题,从消息、子事件和事件这三个不同的尺度对谣言事件进行建模,再逐层地进行可信度传播;基于正反向可信度传播的方法,考虑到谣言事件中存在的质疑和反驳信息,通过挖掘事件中的对立观点来建立消息之间的观点支持/反对关系,再基于正反向地关系进行可信度传播。实验结果证明,本文提出的方法相比现有的孤立的分类检测算法更加有效。
其他文献
浏览器是人们上网的一个重要工具。近年来,随着我国移动通讯业的发展,手机终端功能的增强,手机上网的人数一直不断地翻倍增长。但是,国内的手机浏览器产品与国外的产品相比存在着
本文设计并实现了基于日志文件的网络电视受众行为统计分析系统。该系统基于目前的主流的P2P网络电视系统的体系结构而设计,和网络电视系统采用日志文件作为数据接口,网络电视
实时集群系统有着广泛的应用,如数字控制系统、在线游戏、股票交易、传感器网络数据处理等。在这类应用中,通常有多个服务节点来响应外界大量的实时请求。由于实时系统和实时理
航拍以其价格低廉、操作灵活、高可靠性等特点,越来越广泛地被应用于社会生活诸多领域,如电网全景管理、石油天然气管道管理、铁路线路动态管理、军事侦察、地质勘探、城市规划
本文研究了Definitely模态下分布式计算的谓词检测问题,即判断在计算产生的格状态空间中,是否每条从最小元到最大元的路径都通过一个满足谓词的状态。本文的主要内容有以下四个
现代化信息技术的发展产生了大量的数字化知识成果,包括音频、视频和图片等。这些数字载体易于复制、更改和传播,同时也容易被攻击者和伪造者利用,从而对知识成果造成损害和负面
模型的配准是很多科研应用领域的基础问题。给定两个三维模型,配准算法对其中一个模型(源模型)作变换使得变换后的模型与另一个模型(目标模型)满足某种(如几何上或拓扑上)对应关系。
人脸识别技术由于其重要的应用价值和理论意义而受到越来越多的关注和应用。一个实用的人脸识别系统需要满足三个特性:精确性、稳定性和易用性,事实上它们也构成了人脸识别技术
随着各领域科学研究的开展,科技文献数据日益受到相关学者的关注。因为科技文献中隐藏着非常丰富的有价值的信息,对其进行深入挖掘具有重要意义。随着科技文献分析适用的方法
在过去的二十年中,数据挖掘和机器学习受到了越来越多的关注。这很大程度上是因为在互联网时代信息传播和积累的速度越来越快,人工处理数据越来越困难,智能化及自动化的数据处理