基于CNN的双向LSTM网络的文本情感分类

被引量 : 0次 | 上传用户:aorong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网时代的崛起和移动设备的发展,每分每秒产生的文本信息不可估量,因此提取文本信息内涵和文本情感评价成为了自然语言领域的热点之一。目前关于文本情感分析的研究核心思想就是对文本特征的提取,文本特征包括词句语义和文本上下文内容联系等。本文基于统计学知识,利用机器学习、深度学习领域的研究成果,在文本情感分类已有模型之上制定改进方案,提出了基于卷积神经网络的双向长短期记忆神经网络模型,将其应用于文本情感分类实证分析,同时在训练改进模型时加入半监督学习算法,提高文本分类准确率。本文总结了文本情感分类的研究现状,研究学习了常用分类模型:基于机器学习的朴素贝叶斯模型和支持向量机模型;基于深度学习框架的卷积神经网络和单双向长短期记忆网络,详细介绍了了模型的工作原理和文本分类流程图。文本数据在输入分类模型之前需要将文本向量化,因此需要研究文本预处理方法和文本向量表示模型。本文通过Word2Vec词嵌入模型的Skip-Gram框架对预处理过的文本数据进行向量化,将文本数据向量化之后输入到分类模型中进行训练和预测,提高模型泛化能力。对比结果显示,基于神经网络框架的BLSTM、LSTM模型的分类准确率高于基于机器学习框架的朴素贝叶斯和支持向量机模型,其模型稳定性也更高。在原有分类模型的基础上,考虑到分类模型的核心思想为文本特征的提取,提出了CNN-BLSTM的改进模型,目的是将卷积神经网络优秀的局部特征提取能力和双向长短期记忆模型全局特征提取的优势结合起来,提高文本情感分类效率,结果显示模型将文本分类准确率从90.49%提高到了93.18%在CNN-BLSTM改进模型基础上,考虑到数据集的一般性,将带有标签数据集与无标签数据集结合起来扩充训练数据集,其方法为半监督学习算法,使训练集的文本数据量达到80万句,以更多的数据去训练改进模型,最后分类测试结果显示,基于半监督学习的CNN-BLSTM模型文本分类准确率从93.18%提高到了94.10%,相比于CNN-BLSTM准确率提高,模型稳定性也显著提高。验证了改进思想的可行性和改进方法的正确性。
其他文献
当前企业集团这一组织形式正深度参与市场经济。在企业集团中,集团公司通过全资、控股、参股等各种股权关系向下派生子公司、孙公司,并牵头带动企业集团的各经济活动,从而形成一个庞大的联合经济体。组织规模的扩大能帮助企业获得规模经济优势、减缓融资约束,但企业集团在组织人事、业务往来、资金融通等方面的复杂性也加速了信用风险在集团内部传递的过程。近年来,众多知名企业集团陆续被爆出重大信用风险,与单一企业相比对市
识别海量居民用户的用电行为模式并进行合理分类,可为需求侧精益化管理提供辅助决策。该文提出一种基于卷积神经网络自动编码器与层次聚类多任务联合模型的居民用电模式分类方法。首先,提出基于同时刻量测数据均值的缺失值填补方法和基于季节性极端学生化偏差检验的异常点检测方法,对海量且高维的用电数据进行数据清洗与修正;其次,利用卷积神经网络自动编码器对居民用电数据进行特征提取,获取可表征用户用电行为的特征向量;然
推进高校基层党建和业务工作深度融合,事关加强高校基层党组织建设,事关高等教育事业高质量发展。本文以高校基层党建与业务工作为研究对象,以深度融合为研究目标,在梳理政策依据、分析推进意义的基础上,总结实践中制约党建与业务融合的认知偏见、行动偏差、形式作风、学用脱节等困境,并以“党建+”的思路,提出机制融合、考评融合、作风融合与理论融合路径,以期全面实现高校基层党建与业务工作的融合发展。
由于散文的特点是"形散而神聚",对于一些初中生来说是比较难把握的一种文体。在核心素养大单元教学背景下,老师可以从更高的角度对这类文体的文章进行整体的梳理和归纳以便更有效的教学,在总结归纳了文章特点后再进行整体的教学策略安排,这样可以大大地提高教学效率也可以效地提高学生的学习效果。
构建人类命运共同体是时代赋予的历史使命,这对涉外法治人才培养提出了新的要求。法学教育改革主要可以从以下三个方面开展,一是紧扣人类命运共同体的价值内涵,更好地融入人类命运共同体理念,二是增加比较法类课程的设置,注重法学与其他学科的交叉融合,三是重新定位涉外法治人才培养的思路,细化相关人才培养目标,在此基础上培养出现代社会需要的人才。
<正>全过程人民民主是一个完整的链条,其中民主选举、民主协商、民主决策、民主管理、民主监督各个环节环环相扣、彼此贯通,相互支撑、相互配合。民主监督的作用主要体现在两个方面:一是使人民的民主权利不因选举结束而中断,二是使权力运用得到"有效制约和监督"。习近平总书记强调,"人民是无所不在的监督力量""要拓宽人民监督权力的渠道"。人大监督是党和国家监督体系的重要组成部分。人民性是人大监督的基本属性。这意
期刊
2020年初,新冠病毒在全球范围内爆发。为助力疫情防控,语言学家开始提倡重新框定冠状病毒,疫情背景下新闻报道中的隐喻现象也成为研究新领域。然而,学者们主要讨论战争隐喻的泛滥现象,缺乏横向对比不同国家间媒体报道的隐喻现象。本研究以Lakoff和Johnson的概念隐喻理论为框架,选取《人民日报》和《纽约时报》关于新冠疫情报道各55篇,借助语料库分析软件Ant Conc3.5.8和隐喻识别程序MIP,
<正>一直以来我国制定的各类教育方针政策强调学生个性化发展,重视学生创新精神和实践能力的培养。在教学实践中,项目式学习逐渐被广大教育者接受,其以建构主义理论为指导,学生作为教学的主体,通过小组合作的动态学习方式规划和解决学习任务。项目式学习模式应用在化学教学中,可以帮助学生更好地掌握学科知识与解决问题,对落实学科核心素养具有重要的意义。
期刊