基于深度学习技术的文本情感分类算法研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:huangxz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术以及网络平台的日益火热,越来越多的人参与到网络信息交互中。如今,大量的文本信息呈井喷式出现,人们通过网络与社交平台来表达自己的见解。通过挖掘这些文本内容,不仅可以了解用户的喜好,了解社会的热点问题,还能得到商品服务的评价信息等因素。因此,文本情感分析无论是从经济或是政治角度都有其重要性。通过对这些文本进行分析、处理、归纳和推理,我们能够在网络舆情发现等应用方面挖掘到重大的商业价值。因此,本文研究了基于深度学习技术的文本情感分类算法,具体内容包括以下几个方面:首先,实现了卷积双向长短期记忆(CNN-BiLSTM)网络模型。该模型结合了卷积神经网络(Convolutional Neural Networks,CNN)能提取高维文本特征和双向长短期记忆网络(Bi-directional Long Short-Term Memory,BiLSTM)擅长处理序列式问题的优点。本文对该模型在文本情感分类问题上进行了研究。包括设计多种规模的卷积核来提取不同的纬度特征,使用可以保留多个较强特征的KMax池化层代替仅能保留最强特征的1Max池化层。实验结果表明,CNN-BiLSTM-KMax模型相对于其他传统网络模型在文本情感分类上效果更好。其次,在CNN-BiLSTM-KMax模型中引入注意力(Attention)机制、提出新的ACBiLSTM-KMax模型、注重在情感分类任务上关注具有重要影响的关键字,可以更准确地分析文本情感倾向。实验结果表明,在模型中引入Attention机制后,模型的处理效果确有提升。然后,在ACBiLSTM-KMax的基础上,本文采用双向语言模型训练动态词向量的ELMo(Embeddings from Language Models)模型代替常用的Word2vec模型。实验结果表明,ELMo模型能使单词在语法变换时以及一词多义的情况下,有效提高词向量的质量,使得模型能在很大程度上得到优化。最后,本文验证并探究了文中提出的模型中各项参数与实验结果之间的关系,具体包括Dropout值,Epoch值,词向量质量和Batchsize参数等。实验结果显示:模型的质量和词向量的质量呈正相关,过大的Dropout会使得模型效果下降,而取值过小则无法缓解过拟合的情况。模型的效果会随着训练次数的增加先提升后下降,最终进入过拟合状态。本文在考虑Batchsize值时则要充分考虑训练时的时间成本和训练效果,再综合样本进行抉择。
其他文献
利用新闻媒体对大学生进行媒介素养,既符合大学生的心理、生理、社会需要,也符合大学生的成才需要,更是全面建设小康社会、加快推进社会主义现代化建设和中华民族实现伟大复
探讨利用中规模计数器芯片设计按非自然顺序循环的任意进制计数器方法,该方法在特殊循环计数器设计的应用中,有着广泛的应用.
介绍了确定平面应力状态主应力方向的两种简便方法,即分别可由单元体上的剪应力和正应力去判断主应力方向,并论证了两种方法的正确性.
以石化建设项目中的超概问题为切入点,拟合出工程量下浮率与价格上涨率的函数关系式,结合敏感性分析试算出成本变动额,为快速准确的对成本预测做出科学估计与控制提供方法。
以应用型人才培养的教学目标为出发点,结合设计类专业的特点,分析了设计类课程微课建设的现状及存在的问题,提出了关于设计类专业构建套餐式微课体系的总体思路及具体操作办
为了准确地测定稻草及其发酵物中纤维素、半纤维素、木质素的含量,通过差重法进行定量测定,并以此评价白腐菌株Pleurotus sapidus对稻草秸秆的降解状况,结果表明:利用差重法测定
目的:脑卒中患者遗留手功能障碍影响其进行日常生活活动。本研究旨在探究镜像治疗(MT)联合经颅直流电刺激(t DCS)对脑卒中后手功能的治疗效果,明确t DCS对MT有无增益作用;同