【摘 要】
:
本文以“基于深度学习的评论文本情感分类”为题展开研究,首先对目前国内外的研究现状和常用算法进行深入的调研,对目前主流的情感分析方法做了简单的介绍和分析。深度学习作为机器学习的一个方向,成为了自然语言处理领域中情感分类的研究热点。本文运用深度学习模型从对中文文本的情感分类问题和跨领域情感分类问题两个方面进行研究。主要研究内容如下:本文使用了一种双向长短期记忆网络(Bi-directional Lon
论文部分内容阅读
本文以“基于深度学习的评论文本情感分类”为题展开研究,首先对目前国内外的研究现状和常用算法进行深入的调研,对目前主流的情感分析方法做了简单的介绍和分析。深度学习作为机器学习的一个方向,成为了自然语言处理领域中情感分类的研究热点。本文运用深度学习模型从对中文文本的情感分类问题和跨领域情感分类问题两个方面进行研究。主要研究内容如下:本文使用了一种双向长短期记忆网络(Bi-directional Long Short Term Memory,BiLSTM)和卷积神经网络(Convolutional Neural Networks,CNN)混合的串行网络结构。首先,利用Bi-LSTM模型提取出文本的上下文的文本信息,并在该模型中加入注意力机制解决文本中不同词语贡献度不同的问题。同时针对跨领域任务,使用源领域数据集训练模型并保存模型权重信息,然后使用目标领域的少量数据集对模型进行微调,更新部分权重信息,实现模型的跨领域迁移。最终实验数据表明,基于注意力机制的双向长短期记忆卷积神经网络(BiLSTM-ACNN)模型在处理情感分类任务和跨领域情感分类任务时,可以有效的提高对中文数据集的跨领域情感分类的性能。传统经典的神经网络模型中存在特征维度过高、池化层特征信息的损失而导致了对情感词汇的细节丢失等问题。本文借鉴胶囊网络在特征提取方面的独特优势,运用基于卷积神经网络的胶囊网络模型对文本情感分类任务进行研究。该模型采用了多种卷积核提取文本特征生成多个特征映射丰富第一层的表述。然后连接有动态路由机制的胶囊网络,胶囊网络胶囊内的神经元活动可以表示文本中词语的属性信息,还能提取文本的结构信息。实验结果表明,深度学习模型可以从原始的数据中提取特征,胶囊网络的动态路由机制可以更好地获得文本特征能力,在情感分类任务中有着较好的表现。
其他文献
目的:观察丙泊酚用于无痛电子胃镜检查的临床效果及安全性。方法:自愿接受无痛胃镜检查的患者86例,均无药物及奶制品过敏史,ASA Ⅰ-Ⅱ级。监测脉搏、血压及脉搏血氧饱和度(SpO2),鼻
认罪认罚从宽制度作为我国当前司法改革和刑事诉讼立法中的重点而备受关注。通过认罪认罚从宽提高诉讼效率,是该项改革的重要目的。值班律师制度的设立为保障程序正义,防止认罪认罚从宽成为正义向效率低头的趋向,当前应重点思考值班律师的有效帮助问题,以保障认罪认罚案件中犯罪嫌疑人、被告人在享有基本人权的基础上自愿、真实地作出认罪认罚的选择。第一部分对值班律师制度进行理论分析。值班律师制度是司法制度发展到一定历史
在智能终端高速发展与云计算技术发展的背景下,OTT设备迅速普及。我国的OTT设备指通过公共互联网,面向电视机传输,由国有机构提供视频内容的网络电视形态,用户可以方便地通过大屏界面安装、使用和卸载各类程序。OTT设备的蓬勃发展开启了客厅经济的崭新空间,融合了互联网与传统电视的特点,已经成为国内数字营销领域的新风口。本课题来自于北京爱奇艺科技有限公司的实际开发项目——银河奇异果应用搜索功能优化,爱奇艺
当前社区发现算法主要是针对无向图研究社区结构,但在实际复杂网络中,链接关系时常表现出非对称性或方向性,比如Twitter的用户关注关系,文献网络的引用关系,网页之间的超链接关系
既然有弹性的汇率制度符合中国经济的整体利益,就该尽量避免政策调整时机再次为外国政客的言论所左右。 人民币汇率在2008年7月与美元重新挂钩,如今已近两年。作为应对全球金融和经济危机的政策组合的一部分,中国的汇率政策安排起到了积极有效的作用。然而,恢复人民币汇率弹性符合中国自身经济发展的整体利益。 从短期市场供求关系看,人民币汇率恢复弹性后,仍将面临升值压力。人民币升值有助于缓解因重要国际商
结合丰满水电站全面治理工程实际,采用ANSYS有限元软件,建立考虑边界条件影响的三维有限元模型。分析计算了新坝施工前、施工期及施工后不同工况下老坝建基面应力情况,可为新
对中文下位词自动抽取方法进行研究,提出一种基于词典信息和网络百科的下位词获取方法,旨在构建一个较为完善的上下位词语知识库.基于词典信息的抽取方法利用《中文概念词典
2009年7月24日-7月29日,《数据采集与处理》第六届编委会第二次会议在沈阳隆重召开,来自全国20所高校35名代表出席了大会。本次会议的主题是:进一步提高期刊质量,争取进入EI数据