基于多模态和深度学习的Twitter谣言检测研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:allyev
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今常用的谣言检测模型受人为因素的影响,难以挖掘信息的潜在特征。推文中图片内容的占比越来越大,如果忽略图片信息,仅从文本角度很难全面检测推文的可靠性。本文针对当今谣言检测方法的缺陷,提出基于多模态和深度学习的Twitter谣言检测模型。主要工作和成果包括:(1)本文提出了一种基于深度学习的BLSTM-CNN谣言检测模型。该模型由双向LSTM和多核CNN组合构成,通过它来挖掘谣言文本的潜在特征。首先BLSTM-CNN模型利用双向LSTM结构对推文的上文信息和下文信息进行记忆,并提取出文本的上下文关联特征。同时利用多核CNN结构来挖掘文本的局部语义特征,此多核CNN拥有三种不同宽度的卷积核,作用是获取文本不同局部范围内具有代表性的特征,并聚合得到文本的全局特征。本文的BLSTMCNN模型基于这两种不同层次的文本特征来对谣言信息进行检测,并在基于VMU任务收集的Twitter谣言基准数据集上进行了实验,结果表明BLSTMCNN模型相比于双向LSTM模型准确率提高了2.48%,相比于CNN模型准确率提高了1.94%。(2)本文提出了一种引入多模态特征的M-BLSTM-CNN谣言检测模型。首先针对推文用户的账号差异性提取出用户特征,并进行了归一化处理。然后基于VGG19网络,从推文所携带的图片中提取出图片特征。接着构建了引入多模态特征的M-BLSTM-CNN模型,该模型通过用户特征、图片特征和BLSTM-CNN模型获取的文本特征拼接得到推文的多模态特征,最后将其输入到全连接层和Softmax中得出推文检测结果。并通过实验对不同模态特征的影响情况进行了分析,结果表明在仅考虑文本特征的基础上分别引入用户特征和图片特征时,谣言检测的准确率分别提高了3.62%和2.61%。完整利用谣言的三种模态特征进行谣言识别时,本文的M-BLSTM-CNN模型取得了最佳效果,检测准确率达到94.41%。
其他文献
<正>在北纬30度线上,有许多奇特的地方,如大西洋上的百慕大三角区、埃及大沙漠中的金字塔、世界上最深的海沟马里亚纳海沟和最高的山峰——珠穆朗玛峰等等,被称为"江南第一古县城"的慈城也恰恰在这个位置上。
期刊
随着化石能源的不断消耗,人们对于清洁能源的需求日益迫切,能源的储存与利用已经成为研究热点。储存与利用能源的同时兼顾环境的可持续发展是当今人类追求生产力发展与环境生态可持续的重要课题。超级电容作为一种潜力巨大,环保高效的储能设备,近些年来持续受到研究与关注。生物质废弃物每年产量巨大,利用生物质制备的生物炭材料在众多领域得到了普遍应用。其中生物炭用于超级电容的电极材料近年来受到广泛关注。本文利用KOH
学位
目前,机器学习技术已经深深扎根于人们的日常生活中,并且已经应用到几乎所有的应用领域。然而,构建一个高质量的机器学习模型是一个迭代、复杂、耗时的过程,同时这个过程需要大量的专家知识去尝试各种算法和技术。随着现实生活中数据量的不断大幅增长,人们已经认识到纵使知识渊博的数据科学家也无法应对这些挑战。因此,自动构建良好的机器学习模型是至关重要的。在最近几年时间里,一些技术和框架被引入来解决机器学习领域中自
学位
分布广泛、储备丰富且清洁无污染的太阳能已经成为能源开发利用热点,然而光伏在发电过程中温度较高,使得硅基光伏板发电效率及使用寿命受到了较大影响。辐射冷却技术的迅速发展使得廉价、环保且不受时间和气候限制提供冷量的冷却散热技术得以实现。辐射冷却与光伏发电技术相结合将综合两者的优势,为提高光伏发电效率及使用寿命提供一个新的途径。针对如何使光伏板温度保持在最佳温度,本文建立了基于辐射冷却的光伏间接冷却实验系
学位
功能性短肽是一类具有特定生物活性和功能的短肽。研究表明,许多功能性短肽可以应用到药物研发和癌症医疗之中,比如细胞穿膜肽和群体感应肽。这些功能性短肽的识别研究对于进一步了解其功能机制并将其应用于医疗领域尤为重要。目前已有许多研究工作致力于对功能性短肽的预测识别中,其中基于机器学习的方法可以完成更加快速准确且低成本的预测。在本项研究工作中,本人分别针对以下两种功能性短肽的基于机器学习的预测方法进行了深
学位
随着科学技术的飞速发展,生物学、医学等领域与计算机的关系越来越紧密,它们已经开始朝着数字化的方向发展。单细胞测序、医学图像以及药物设计等每时每刻都在产生大量的数据,这些海量的数据给研究人员带来了巨大的挑战。特征排序和降维是机器学习和生物信息学研究中的关键方向。特征提取后的生物序列数据可以通过机器学习进行科学研究,但是经过提取的特征中存在很多问题,例如特征与特征之间容易出现冗余问题。我们通常只希望使
学位
“厕所革命”,民生工程。2014年12月,习近平总书记在江苏调研时表示,解决好厕所问题在新农村建设中具有标志性意义。本文以高寒、缺水地区旱厕建设为案例,旨在研究通风、安全、低能耗、无害化、资源化的生态旱厕。论文结合实际试点建设工程,研究生态旱厕在高寒地区安全稳定运行的可行性,主要内容和成果为:(1)对旱厕系统工程进行整体性设计。根据实际调研,确定旱厕建设地址,以及旱厕设计面积大小。结合当地实际,设
学位
高热湿环境广泛存在于人的生产和生活中,当人们处于这种环境生产或生活一段时间,会影响人体的热舒适感,甚至影响人员的身体健康,严重者可能导致生产事故的发生。因此研究高热湿环境对人体客观和主观参数的影响具有重要的意义。本文的研究目标是以人体热反应为依据,开展人体热应激实验,提出人体综合生理指标,将高热湿环境进行分区,通过识别不同分区的安全劳动时间,建立综合生理指标与环境参数的预测模型,为缓解劳动人员的生
学位
随着经济的发展和工业化进程的加快,挥发性有机物(Volatile Organic Compounds,VOCs)的排放量急剧增加。严重威胁着人类和环境。吸附技术因由于其具有易于操作、灵活、有效和低成本的等特点在VOCs处理技术中尤为突出。其中多孔碳吸附剂应用更为广泛,可以由化石燃料、生物质和其他富含碳的原料生产得到。生物质作为可再生原料,具有高含碳量和低成本的特点,逐渐被作为制备活性碳的优良原料。
学位
高分辨率、宽视场的正射影像是影像地图的基础数据,可用于林业、气象、水利、规划等政府部门。随着人工智能的发展,无人机由于具有响应能力强、飞行高度低、时效性和性价比高等优势成为正射影像采集的主力军。但因无人机飞行能量限制,如果不进行合理的路径规划,则会降低正射影像采集的效率。本文以无人机正射影像高效、集约采集为应用背景,对限定条件下的无人机区域覆盖问题进行研究探索,寻找一条能够让无人机平滑跟踪且能量最
学位