【摘 要】
:
情感分析作为自然语言处理的重要组成部分之一,其主要任务是识别和处理给定文本中包含的情感极性、强度等信息。目前情感分析技术广泛用于舆论监测、金融分析、决策支持等任务当中,对政府、金融、商业等领域产生了重要影响。以往的研究将重点放在情感词典的构造和特征提取方法的改进上,但其采用的方法耗时耗力不宜维护且迁移性差。近年来深度学习因其可自动学习数据特征的优势成为了自然语言处理的主流研究方法,然而该方法在处理
论文部分内容阅读
情感分析作为自然语言处理的重要组成部分之一,其主要任务是识别和处理给定文本中包含的情感极性、强度等信息。目前情感分析技术广泛用于舆论监测、金融分析、决策支持等任务当中,对政府、金融、商业等领域产生了重要影响。以往的研究将重点放在情感词典的构造和特征提取方法的改进上,但其采用的方法耗时耗力不宜维护且迁移性差。近年来深度学习因其可自动学习数据特征的优势成为了自然语言处理的主流研究方法,然而该方法在处理情感分析时忽略了词序信息对分类结果的影响,且在提取句子结构和过滤无效信息方面也有不足。因此,通过改进深度学习模型来解决上述问题对于提高文本情感分析的性能有着重要意义。基于以上的考虑,首先,本文为了解决深度学习情感分析方法在获取词序信息和句子结构信息方面的不足,设计了一种结合Doc2vec的卷积神经网络模型CMCNN。一方面,将Doc2vec模型训练得到的段落向量作为卷积神经网络连接层的附加向量来提供传统词向量所欠缺的词序信息。另一方面,本文的CNN模型在池化层上与传统的CNN不同,采用Chunk Max Pooling策略保证CNN模型在训练过程中获取重要特征的同时保留其位置信息,从而使得该模型既能获取对情感分析有效的语义信息又能获取足够的句子结构信息。随后,本文在CMCNN模型的基础上又构建一个结合CNN和RNN模型优势的融合模型At-CMC&BR,一方面该模型结合了CMCNN的由局部整合至全局的特征提取能力、词序信息提取能力、句子结构信息提取能力和BiRNN的上下文关联信息特征提取能力,另一方面,本文在模型中加入能够增强关键信息权重的Attention机制,进一步提高融合模型在解决句子级情感分析上的性能。最后,本文将设计的模型与几个基准模型进行实验对比,结果表明CMCNN和At-CMC&BR均在IMDB和SST标准数据集上的得到了较高的分类准确性,验证了本文设计模型的有效性。
其他文献
<正>目前金融同业的发展是多元化的,并且越来越精细化,各种面向客户的金融服务日益增多,这一切均由金融同业对金融数据的分析、统计、包装、展现为基础。各大金融同业都已有
畜禽养殖是我国农村许多家庭重要的经济来源,发展畜牧业也成为当前地方政府落实精准扶贫和脱贫攻坚的有力举措。本文分析了当前农村畜牧生产存在的主要问题,提出了新形势下农
本文以双汇国际成功并购史密斯菲尔德公司为例分析了我国企业跨国并购的财务风险及其防范,对我国企业海外并购提出合理建议,以期为今后提高我国企业跨国并购的成功率提供借鉴
胃肠激素(Gastrointestinal Hormones)在功能性消化不良(Functional Dyspepsia,FD)发病机制中的作用越来越受到人们的重视,对近年来有关功能性消化不良与胃肠激素的关系、中
文中介绍了凤县建立GPS控制网以及似大地水准面精化高程与水准高程相比较精度情况,确定精化高程能满足工程需要。
<正>迅速发展的社交网络对人们的日常生活、社会交往、商务沟通、娱乐活动等带来了重大影响,主要表现在以下方面:一是社交网络的注册用户数量巨大,根据美国市场研究公司eMark
<正>中国农业银行软件开发中心在以"前台前移、中台上收、后台集中"的流程银行再造思想指引下,自主研发了中国农业银行运营集中平台(以下简称运营集中平台),实现了"统一服务
南宋时期,由于宋室定都临安(今杭州),极大地推动了浙江政治、经济、教育、科技、文化的发展,从而带动了医药事业的嬗进。建置浙江的中央及该省医药卫生机构较为完善,御药院、
[目的]观察丹参饮合炙甘草汤对心绞痛患者心肌缺血总负荷(TIB)的影响。[方法]将符合诊断标准的56例患者随机分为治疗组(30例)和对照组(26例),治疗组用丹参饮合炙甘草汤治疗,
<正>蔓延全球的经济金融危机暴露了金融监管领域的诸多漏洞,突显了改革全球治理机制、完善金融监管体系、加强国际监管协调的必要性和紧迫性。危机爆发以来,改革国际金融组织