【摘 要】
:
方面级情感分类旨在识别一个句子关于给定方面表达出来的情感极性,目前,实现该任务的主流方法之一是基于深度学习的方面级情感分类模型。本论文在对现有基于深度学习的方面级情感分类模型进行深入分析后,发现这些方法存在以下几点不足之处:第一,在方面级情感分类模型中,基于循环神经网络的注意力模型性能较优,但模型在编码过程中对数据进行顺序处理,不能并行运行数据,计算效率低。第二,现有的深度学习模型中上下文与方面词
论文部分内容阅读
方面级情感分类旨在识别一个句子关于给定方面表达出来的情感极性,目前,实现该任务的主流方法之一是基于深度学习的方面级情感分类模型。本论文在对现有基于深度学习的方面级情感分类模型进行深入分析后,发现这些方法存在以下几点不足之处:第一,在方面级情感分类模型中,基于循环神经网络的注意力模型性能较优,但模型在编码过程中对数据进行顺序处理,不能并行运行数据,计算效率低。第二,现有的深度学习模型中上下文与方面词之间的交互没有充分实现,这在很大程度上限制了模型的有效性。第三,目前主流的模型大多没有充分分析词的贡献,常用的Word2vec、Glove词嵌入方法无法表达同一词在不同语境下的语义,从而生成的词向量无法准确表达上下文的语义。在对上述问题进行深入分析和研究的基础上,本文提出了基于多头注意力(MHA)的方面级情感分类模型(SCBMA)。论文的主要工作如下:(1)充分利用多头注意力。采用高效的MHA和卷积运算代替传统的神经网络获得隐藏状态,然后通过平均池化和MHA进一步实现上下文与方面词之间的交互,提出基于多头注意力的方面级情感分类模型(SCBMA)。(2)提升词向量的质量。通过预训练的BERT模型捕捉字符级、词级、句子级、句间等复杂关系,得到每个词丰富的特征,为下游任务提供扎实的基础。将针对特定任务设计的SCBMA模型应用于BERT模型(SCBMA-BERT),BERT模型通过对特定任务进一步微调,能够更好地释放BERT的性能。(3)在方面级情感分类领域广泛应用的3个数据集上进行了实验,且与目前几种先进的方面级情感分类方法进行了对比,结果表明本论文提出的模型实验结果优于其它对比方法,证明本论文提出的模型在不同领域的数据集上实验的准确率及macro-F1值均有提高。
其他文献
随着互联网技术的发展和各种终端设备的出现,人们获取信息的方式、生活的方式发生巨大的改变。分类信息平台、电商平台的出现,给商业带来了巨大的发展机会,同时伴随着风险。各种虚假的信息充斥在我们的生活中,用户无法分辨信息的真实性,给社会带来了负面影响、给人们带来了经济损失。交易平台通过为用户提供第三方支付、保险、评论等功能提供信任来保障交易,但使用这些功能的时候,个人信息可能泄露,可能遭遇虚假的信息与交易
风电机组通常安装在环境恶劣的偏远地区,长期受到雨雪、沙暴、雷击等因素的影响,容易发生故障,其运行过程中的健康状态至关重要。风电齿轮箱作为风电机组设备中的关键部件,在风机传动系统中占据重要地位,其健康状态直接影响到风电机组的使用寿命。因此对风电齿轮箱进行状态监测诊断,是一个重要的研究课题。目前,风电齿轮箱的状态监测诊断主要采用数据采集与监测系统(Supervisory Control and Dat
半导体异质结在光催化制备氢能源和光伏发电等领域表现出了强大的潜力,被认为是最具有前景的新能源制备材料之一。然而目前半导体异质结种类繁多、装配技术复杂,筛选具有优秀性能异质结的实验工作量大且难度高,急需理论工作的指导。半导体异质结的光催化和光伏性能主要取决于其电子结构和光学性质。基于密度泛函理论(DFT)的第一性原理计算能有效预测以上两种性质,是研究半导体异质结光催化和光伏性能的强大工具。本文选取B
阻抗源逆变器(Impedance source inverter,ISI)作为单级拓扑结构,具备升降压调节和逆变输出能力,且允许桥臂直通,克服了传统逆变器在电压调节范围、可靠性等方面的固有缺陷,被广泛应用于电动汽车、风电、光电等新能源领域,是当前最具发展前景的逆变器拓扑之一。新能源领域阻抗源逆变器常工作于极端环境,可靠性和谐波问题突出。本文以提高阻抗源逆变器可靠性和输出谐波性能为研究目标,对不同调
风能资源的波动性与随机性导致风电发电功率呈现随机性与间歇性,大规模风电并入电网会对电力系统的运行产生较大影响。为了解决由风的波动性与随机性导致的风电并网问题,提高风电利用率、推动新型可再生能源的发展,认识到风电和水电天然优势互补,风水发电协调运行是促进新能源消纳的有利途径,本文从风水发电联合运行入手,考虑到气象预报是风水发电调度的关键支撑环节,气象预报的不确定性直接影响到风力发电与水力发电的输出功
在光学三维测量技术领域,双目视觉和结构光技术被广为采用。双目视觉在弱纹理区域以及重复纹理区域进行立体匹配时容易产生误匹配点,导致重建精度较低,而在结构光技术中,投影仪标定精度低,且极易受光强影响。近年来提出的双目结构光则结合了两者的特点,解决了上述问题,但也存在一些仍亟待解决的问题。双目结构光和双目视觉一样,存在遮挡问题。从匹配算法的角度而言,遮挡区域的像点在目标匹配图像中没有对应的匹配点。此外,
一直以来,压电振动能量转换装置的研究用以解决无线传感器网络的能源供应问题。传统线性压电振动能量采集器结构虽简单,但能量转换频带窄,仅在环境振动与采集器共振频率相匹配时,才能产生高电压输出。鉴于现实环境中的振动频率是随机波动的,而非一个稳定值。为提高能量转换性能,需要拓宽采集器的共振带宽或使采集器共振频率可调。对此,本文提出了一种基于折纸耦合的宽频带非线性双压电悬臂梁能量采集器,其在线性阵列原理基础
随着互联网技术的快速发展和“互联网+”行动的实施,各种应用程序广泛使用。互联网已经渗透到人们日常生活的方方面面,然而,人们在享受科技带来便利的同时也面临着许多信息安全问题。在现有的网络安全技术的防护下,黑客假冒合法用户入侵系统进行恶意破坏仍然可能存在,全球每年因信息安全事故而蒙受巨大的经济损失,如何增强网络安全保障仍是一项挑战。本文有三个目的:(1)探究网络环境下人的鼠标操作行为模式(简称鼠标行为
聚类分析作为一种无监督的学习方法,是最重要的数据挖掘工具之一,其重要性及与其它方向的交叉特性在数据挖掘、机器学习等各领域中得到广泛应用。聚类分析的目的为通过寻找数据中隐藏的数据结构,将获取的数据按一定的约束和判定准则聚成不同的簇,使得同一簇中数据点间的相似性大,不同簇间的相似性尽可能的小。K均值聚类算法是聚类问题中比较经典的算法,由于其简单易行、效率高、适应性强等特点,在机器学习领域的应用十分广泛
随着全球化石能源日益枯竭,汽油柴油汽车所造成的污染以及温室气体排放问题的日益凸显,对于采用更清洁能源的新能源汽车的研究迫在眉睫。在新能源汽车中,采用电能作为能源动力的纯电动汽车因为电能制备方便,电池技术相对成熟的原因,被认为是下一代新能源汽车中的主流。电动汽车一般采用锂电池作为车载电池,而电池的热建模问题一直是锂电池研究领域的热点,对提高电动汽车安全性非常重要。本文主要对某款LG层叠式三元锂离子电