基于深度学习的不同粒度下的文本情感分析研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:dahinter11
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着在线社交网络的兴起,大量的用户在互联网上发表文字表达自己的情感,其中既包含对生活、事件的情绪抒发,又包含对产品各个方面的使用体验和评价。这些情感表达为文本情感分析研究提供了数据基础。文本情感分析研究人们在文本中表达的情感、态度、观点、情绪。情感分析任务存在不同的粒度,包括句子级、目标级和方面级。在不同应用场景需要使用不同粒度的情感分析。不同粒度下的情感分析任务由于本身数据结构的特点,各自有着不同的问题和挑战。首先,对于句子级情感分析,现有方法没有考虑如何进一步挖掘文本的数据信息,或者利用模型中的某些输出信息,来进一步提升现有情感分析模型的结果。其次,对于目标级情感分析,忽略了不同目标实体之间的情感依赖信息,而不同目标之间的的依赖关系信息可以为目标级情感分析带来额外有用的信息。最后,对于方面级的情感分析,现有的模型仍然无法准确地捕捉句子中对于特定方面的相关信息。针对不同粒度下的情感分析相关问题,本文的主要工作有:(1)针对句子级情感分析任务,通过利用模型中学习到的信息进行学习策略的优化,本文提出了对偶再生网络(Dually-Born-Again Network,DBAN)以提高现存模型的性能。对偶再生网络通过迭代方法同时训练教师网络和学生网络,教师网络和学生网络共享大部分参数。训练多轮学生网络不需要重新初始化学生网络的参数。此外,通过集成学习方法还可以进一步提升DBAN的性能。DBAN可以改善情感分析中现有的最新DNN模型的性能。实验结果表明,DBAN确实能有效提高现有网络的性能。此外,DBAN的性能优于再生网络(Born-Again Network,BAN)。(2)针对句子级情感分析任务,通过进一步挖掘数据内部的信息,本文提出了基于样本精炼机制的句子级情感分析方法。样本精炼机制通过研究深度学习模型准确率与模型的概率分布输出的关系,预测出对模型训练有害的样本。样本精炼机制在无需引入额外的语言知识,也无需修改模型结构情况下,通过减少有害样本的训练权值,提高现有模型的情感分类的准确率。此外,本文引入集成学习,进一步提高对训练有害的样本判断的准确率,从而进一步提高了原模型对于句子级情感分析的性能。最后,本文将样本精炼机制和对偶再生网络相结合,对模型进行更进一步的优化。通过实验论证,结合样本精炼机制和对偶再生网络确实可以进一步提高句子级情感分析的分类准确率。(3)针对目标级情感分析任务,为了有效地对依赖关系进行建模,本文中提出了一种使用图卷积网络对情感依赖关系进行建模的新方法,称为情感依赖图卷积网络(Sentiment Dependencies with Graph Convolutional Networks,SDGCN)。该模型可以有效地捕获一个句子中多目标之间的情感依赖关系。SDGCN首先引入带有位置编码的双向注意力机制,以建模每个目标和其上下文之间的特定目标的表示,然后在注意力机制的下一层采用GCN来捕获一个句子中不同目标之间的情感依赖性。本文的是第一个采用GCN进行目标级情感分类的工作。在本文的方法中,每一个目标被视为一个节点,而用边来代表两个节点之间的情感依赖关系。所提出的方法在Sem Eval 2014数据集上进行了评估。实验表明,我们的模型优于最新方法。我们通过进一步进行实验来评估GCN模块的有效性,结果表明不同目标之间的依赖关系对于目标级情感分析是非常有帮助的。(4)针对方面级情感分析任务,为了更准确地捕捉方面相关的上下文信息,本文提出了一种基于渐进式注意力网络(Gradual Attention Network,Gra AN)的方面级情感分析方法。该模型由多级的渐进式注意力机制组成,前级的注意力机制模块是比较平滑的,可以注意到更多的词,捕捉到的信息更为全面。前级的注意力机制更容易捕捉到方面相关的信息,此部分信息的泛化能力更好。在前级注意力机制的基础上,接上后级的注意力机制。后级的注意力机制模块是比较锋利的,可以捕捉更为精确的局部信息。通过将多级的注意力信息结合起来,模型既能把握全局信息,也能关注局部的信息。此外,本文在模型训练过程中加入了一个基于方面类别的辅助损失。通过对方面信息的学习,让模型可以学习到更多与方面相关的信息,让模型可以更准确的关注与方面相关的词。我们在两个Sem Eval数据集上进行了充分的实验。结果表明,Gra AN取得了最佳性能,并验证了渐进式注意力的重要性。
其他文献
传感流数据指来自设备和传感器、反映物理世界状态的一类序列数据,具有持续、时变、复杂、不确定等特征。利用服务抽象和数据融合等手段提升其价值密度和共享程度是当前研究热点。现有方法面临的难点问题包括:如何捕捉物理传感源变化与动态数据关联并适应性调整数据映射策略,如何以数据驱动的方式主动、有效的捕获传感流数据中的价值信息,以及如何保障应用并发或动态数据请求的实时性需求。本文针对上述难点问题展开研究,主要工
研究肺癌近距离粒子植入手术中的剂量规划以及手术导航,对临床手术的准确执行具有很大帮助,并得到了广泛关注。本论文通过对机器人辅助近距离粒子植入治疗技术中剂量规划及手术导航方法的分析,研究了精准的逆向剂量规划以及机器人导航,可在很大程度上达到提高粒子植入精度、减少副作用、提高手术疗效的目的。本研究能够同时促进医疗机器人领域以及肿瘤治疗领域的发展,主要研究内容和成果如下:(1)提出了一种基于共面模板的混
快速、准确地获取工件表面的坐标数据在工业领域具有广泛的应用,如工件的定位与检测,逆向工程,以及快速成型制造。随着现代工业的快速发展,对产品的功能、结构、外形的要求越来越高,这也对测量系统的性能提出了更高的要求。单一测量传感器已经不能满足现代工业对测量的精度、效率以及智能化水平越来越高的要求。因此多传感器测量技术越来越受到人们关注,已经成为现代工业测量技术的重要发展趋势。本文提出了一种接触式测头与线
本文密切结合高性能工业喷涂机器人在汽车制造等行业中的重大需求,系统研究了一种7R 6-DOF型喷涂机器人的构型设计、逆运动学算法及奇异性分析、静刚度建模、结构优化设计、参数标定等关键技术问题,旨在为这类喷涂机器人的自主研发和工程应用奠定坚实的技术基础。全文得到了以下创新性成果:在结构创新设计方面,通过分析汽车车身喷涂工艺特点和对喷涂机器人的运动要求,集成4R 3-DOF型手腕和3R关节型手臂,提出
戏曲和民俗版画是中国传统民众生活极为重要的组成部分,两者在长期的历史发展过程中发生了诸多的文化交融与碰撞,多地的民俗版画生产中便出现了大量表现戏曲故事的画面,这种作品则多被称为“戏曲民俗版画”。作为一种将戏曲文化与木刻版印相结合的民间艺术,自明代出现萌芽以来,经过清代的发展,逐渐成为极受民众欢迎的民间美术形式之一。鲁西南地区自宋元以来便是戏曲文化的繁盛之地,当地戏曲剧种、剧目众多,戏曲表演在民众日
气体探测技术是仪器科学领域的重要研究方向,对气体组分的有效测定和实时监控,在环保、安防、医疗等各个领域发挥着重要作用。气体探测技术包括传感器技术、信号处理技术、信号传输技术及控制技术等。其中,气体传感器技术仍面临着如何快速识别复杂气体,如何构建便携、灵敏、响应快以及成本低廉的气体分析系统等诸多挑战。目前,基于传感器阵列的电子鼻技术逐渐起步,并对传统技术产生了革命性的影响。然而它仍存在系统尺寸偏大、
微创外科手术机器人可以克服传统手术存在的不足之处,有效拓展医生手术操作的能力。本文针对腹腔镜手术机器人系统设计中的工作性能评价关键问题开展研究,主要创造性成果如下:为满足机器人辅助微创手术安全操作的要求,提出了基于工作空间、碰撞干涉、灵活性、关节运动优化及手眼协调性的机器人操作性能综合评价指标,并建立了基于多目标优化的术前规划模型。通过采用多目标粒子群优化算法对该问题进行求解,实现了对机器人术中操
精密数控机床广泛应用于航空航天、精密加工领域,是保障国防和国家工业发展的基础装备。直线运动轴是数控机床的核心传动部件,直线轴的重复定位误差反映了机床定位的稳定性和一致性,是机床的核心精度指标。本文主要研究了机床直线轴重复定位误差抑制技术和机床误差评价方法的相关理论与方法,涉及直线轴重复定位误差机理、抑制技术和直线轴误差及整机误差的评价方法等研究内容。针对直线轴重复定位误差机理不清的问题,从理论研究
光纤MEMS法珀传感器具有灵敏度高、体积小、抗电磁干扰、耐高温、可靠性高、可批量化生产等优势,非常适用于航空航天等领域中大气物理量的传感。本文针对大气物理参量高精度、同时测量的需求,开展了光纤MEMS复合法珀传感器的研究。对光纤MEMS法珀压力传感器中影响测量精度的因素进行理论分析,提出法珀微腔内部残余气压长期监测方法。研究了高精度光纤MEMS复合法珀折射率和温度、气压和温度传感器,实现了双参量同
搅拌摩擦焊技术(FSW)是一种通过搅拌热塑性变形的固态金属实现连接的新型焊接方法。该方法避免了常见的熔焊缺陷,能够形成性能好且成形美观的焊接结构,已在航空航天、高速铁路等行业广泛应用。然而,FSW过程中常出现孔洞缺陷,严重影响焊接接头的力学性能。为避免孔洞缺陷的形成,需在焊接试验之前选择合理的焊接参数、试板材料和尺寸,以及搅拌头材料和几何形状,以形成无孔洞缺陷的焊接接头。试验中即使采用合理的焊接条