基于深度学习的微博新闻谣言检测研究与实现

来源 :北京邮电大学 | 被引量 : 4次 | 上传用户:sz398143634
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的发展和应用的普及,互联网中的信息量正以指数级别的速度飞速地增长,已经成为了一个巨大的信息库。也正因如此大量不可靠的信息可以快速地在人群中传播。而社交媒体上的谣言泛滥可能会导致社会混乱,进而影响人们正常的生活秩序。特别是在面临突发公共事件时,广泛传播的谣言可能会具有极大的破坏性。谣言检测是自然语言处理中文本分类的子任务。谣言检测的主要目的是识别没有丝毫结构规则可言的新闻文本,判断其是否为假新闻(谣言)。在当今社会,微博已经成为人们日常生活中不可分割的一部分,因此本论文选用微博作为实现谣言检测的平台。本课题的研究目的是从海量微博新闻文本信息中,挖掘其中的蕴含的特征,并提出一种新的谣言检测的方法,以微博上的新闻文本和用户评论为数据,对其进行建模,找出分类的关键特征,并以深度学习模型进行分类预测,判断其是否为假新闻(谣言)。所以,本文的主要工作如下所示:1)研究基于用户对于微博新闻观点的谣言检测算法。在社交媒体中,用户可以自由直接地表达对于新闻的看法,用户对于该微博新闻的态度,可以作为一种很重要的特征。因此,本算法同时将评论分为两种大小不同的粒度:词语和评论句子,并结合两种粒度提出了一种谣言检测算法。之后在数据集上与经典谣言检测算法进行了对比试验,验证了算法的有效性。2)研究基于微博新闻文本的情感分类算法。谣言往往带有很强的煽动性,希望会得到广泛的关注与传播,因此大部分会带有比较强烈的感情色彩在其中。本文基于经典的文本分类算法,结合情感词典,提出了一种新的文本情感分类算法,使算法模型对于情感词可以给予更多的关照,并通过实验和经典方法进行对比,验证了算法的有效性。3)结合上述两种结果的算法。本文主要综合考虑了情感倾向和用户态度这两个维度的特征对谣言检测可能产生的影响,因此,通过预训练的方式,将上述两种模型产生的结果进行结合。4)原型系统的设计与研究。本论文以微博为平台,用以实现自己的原型系统。
其他文献
本文在传统的CPPI策略模型基础上,引入MACD指标,并进行相应的内生化,用于替换现有的风险乘m。同时采用类似"棘轮"的方法,构造新的最低要保额度函数,实现动态可变的要保额度,
促销是商家吸引和促使消费者进行大量购买的惯用手段,但频繁的促销会导致消费者促销预期的形成,这种心理预期一旦形成,就会严重削弱正在进行的促销活动的吸引力,减少消费者对
为支持国家对短波频段的科学管理,国家无线电监测中心福建监测站开发了短波频段基础数据采集与分析系统。本文叙述了该系统的构成及实现的基本功能。该系统在福建监测站安装
管理学缺少了管理实践就成了空中楼阁;管理实践缺少了管理学的理论阐释,只不过是一个个故事而已。建立在管理实践基础上的德鲁克管理学,是管理实践与理论阐释交相辉映的管理
投保人未如实告知的,保险人可以争议保险合同的有效性。但是,保险立法例对于保险人争议保险合同的有效性的权利从多个角度附加限制,包括但不限于可争议事由、可争议期间以及
<正> 作者的话本书提供的和青年校长的谈话材料,曾于1965—1966年在《国民教育》杂志上发表过。这些材料引起了学校领导人的兴趣。作者在把杂志上的文章整理成书时,增加了关
本文对美国基础教育科学课程标准实施环节涉及的州的作用、教师、学生、课程与教材、评估与测验、社区与公众支持等要素作了简要分析,借以具体化和深化对美国基础教育科学课
目的:探讨精神疾病患者合并四肢骨折的外科治疗方法及相关问题。方法:1997年4月~2009年3月间共收治56例精神疾病合并四肢骨折患者,其中内固定术49例,外固定术7例;同时积极治疗
回良玉指出:伊斯兰教是一个热爱和平的宗教,中国穆斯林历来热爱和平安宁、反对动乱分裂,一贯主张宽容和睦、珍惜团结稳定。
前言 道路交通标线在中国的应用已经有了几十年的历史.随着我国国民经济和公路建设的飞速发展.道路标线涂料的品种也越来越多.功能越来越趋于完善。