基于句法信息和门控机制的方面级情感分析

来源 :兰州财经大学 | 被引量 : 0次 | 上传用户:iammycsj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
方面级情感分析,是一种细粒度情感分析任务,其目标是判断评价对象的方面(也称属性,本文中均称之为方面)所属的情感极性。对于管理者而言,方面级情感分析可提供更精细的消费者对商品或服务的态度及观点,以此作为其改进产品或服务的依据;对于消费者而言,方面级情感分析可提供其他消费者对某种商品或服务所表达的情感及观点,以此作为其制定购买决策的依据。在方面级情感分析任务中,虽然基于传统机器学习的方法已经取得较好的实验结果,但这些方法很大程度上依赖于人工构建特征的有效性,并且需要大量人力劳动。使用基于长短时记忆神经网络(Long-Short Memory Neural Network,简称为LSTM)的模型,不需要人工构建特征,就可以从句子中学习到丰富的文本信息;通过引入注意力机制而获得上下文词对方面词的重要性程度,进一步增强了模型的预测能力。但是,这些基于LSTM的神经网络模型,采用对文本内容和方面分别建模的方法,对较长的文本序列,其情感特征在传递过程中可能会出现信息丢失的风险。基于注意力机制的模型,欠缺有效编码方面特征和情感特征的能力,并且随着注意力机制的引入,增加了神经网络模型的参数,可能会产生计算复杂度较高和过拟合的风险。因此,针对基于LSTM和注意力机制的神经网络模型,在方面级情感分析任务中不能有效编码方面特征和情感特征,从而导致文本信息表示不够合理的问题,本文提出基于句法信息和门控机制的神经网络模型(Aspect-Level Sentiment Analysis Based on Syntax Information and Gating Mechanism,以下简称SIGM模型)。模型主要结构包括:词嵌入层、Bi-LSTM层、句法信息层、卷积层、Tanh-Relu门控机制、池化层、输出层及Auto-Encoder结构。(1)词嵌入层和Bi-LSTM层。从词嵌入矩阵中获取文本序列中每个词语的词向量表示。然后,以采用词向量表示的文本序列作为输入,经过双向LSTM神经网络模型后,得到包含有上下文语义联系的词语的隐藏输出表示。(2)句法信息层。在文本序列中,与方面不同距离的上下文词,对方面的情感极性所产生的影响各不相同。本文使用文本序列的句法信息,来关注句法路径中与方面不同距离的上下文词对方面情感极性的影响。(3)Tanh-Relu门控机制。为有效建模方面特征和情感特征之间的联系,在双向LSTM神经网络模型的隐藏输出层上构建两个独立的卷积层,并将其分别与Tanh和Relu非线性门相连,本文将此结构称为Tanh-Re Lu门控单元。这个TanhRe Lu门控单元用于结合上述两个卷积层的输出结果,使得Tanh-Re Lu门控单元可以根据给定的方面信息选择性的提取与其较匹配的情感特征,进而判断方面所表达情感极性。(4)Auto-Encoder结构。在方面实体的情感分析任务中,方面实体通常由多个词或短语构成。传统的方法,通常将这些词向量表示求平均后来作为该方面实体的表示,这可能会遇到不能合理表示该方面实体信息的问题。为提升方面实体的信息表示能力,本文构建出Auto-Encoder结构以合理表征其所包含的方面信息,进而达到增强方面实体特征表示的目标。最后,为验证所提出的SIGM模型的预测性能,本文使用Laptop和Restaurant文本评论数据进行实验探究。实验结果显示,所提出的SIGM模型在上述2个数据集上的准确率和F1值均优于其他对比模型,证实了模型的有效性。同时,进一步开展实验分析发现,本文所提出的SIGM模型能高效的预测出文本评论中不同方面所属的情感极性。
其他文献
信息时代产生的海量数据,使得数据挖掘成为当今各行各业制定销售策略、寻找精准客户群等工作的重要手段,其中频繁项集挖掘(Frequent Itemset Mining,FIM)和高效用项集挖掘(Hi
在生物过程、药物设计、催化过程和材料化学等领域,分子间相互作用能的计算都是重要内容。利用量子化学方法计算分子间相互作用能则是当前较重要的量子力学方法的应用。在量子化学众多的理论计算方法中,人们因密度泛函方法将HF方法没有考虑的库仑相关近似表现了出来,提高了计算的精度,而多选择此方法应用于相关体系的计算。其中,应用最为广泛的是B3LYP泛函,但由于B3LYP泛函没法准确描述色散作用,所以B3LYP泛
目前航空用微小型精密器件的装配自动化程度不高,主要依靠手工装配达到预期精度。尽管手工装配能够灵活地应对各种复杂装配关系,但是存在产品性能一致性差和生产效率低等问题
随着我国交通体系日益现代化,盾构隧道逐渐向大断面、大埋深、超长化方向发展,由于单层管片衬砌结构已经无法满足预期设计目的及结构耐久性要求,双层衬砌结构被逐渐采用。而我国长期以来地震活动十分频繁,如何正确认识双层衬砌结构地震动响应特性是现阶段极为重要的问题。鉴于此,本文依托广深港客运专线狮子洋隧道工程,采用资料调研、数值分析的研究方法,对盾构隧道双层衬砌结构的地震动响应规律进行了系统的研究,文章开展的
光滑粒子流体动力学(SPH)方法是一种纯拉格朗日型的无网格方法,能够摆脱网格对计算的约束,相对于传统网格方法有独特优势,特别适合模拟涉及大变形问题以及高速冲击问题。本文鉴于SPH方法的优势,运用Fortran语言编译建立了冲击动力学平台,在验证程序准确性之后,对高效毁伤中的一些前沿问题进行了如下的研究工作:(1)随着现代战场环境的变化,传统罩材的聚能战斗部渐渐不能满足现代战争的作战要求,本文对一种
21世纪是信息技术突飞猛进的时代,尤其是互联网技术的在现代企业的应用与发展。国内外企业为了在激烈的市场竞争下占据主动、赢得先机,不仅要对快速多变的市场信息(包括客户信息、行业信息、竞争对手信息)作出第一时间的响应,并且要求对信息资源进行共享。同时随着全球市场经济不断发展,买方市场的不断扩大,全球经济市场一体化的趋势原来越明显,对于一个中国企业来说,这无疑更加大了企业经营管理的难度,如何在确保产品质
NiTi合金的形状记忆效应、超弹性、良好的生物相容性,优良的抗腐蚀性,低的弹性模量和良好的延展性等优良的力学性能使其在生物医疗领域、航空航天和智能材料等领域具有广泛的实践应用。但是,NiTi合金与同质材料和异质材料的连接难题使NiTi合金在应用过程中仅能具有简单的几何结构,从而限制了NiTi合金更加广泛的应用。为此,相关学者提出采用电阻焊接和激光焊接等手段,但由于焊接使得接头部分易产生脆性的第二相
高温质子交换膜燃料电池(HT-PEMFC)具有能量转化率高、环境友好、耐CO毒化能力强、水热管理简单等优点,在移动电站、热电联供、动力电源等领域应用前景广阔。HT-PEMFC工作温
有机发光二极管(OLED)近年来由于其自身重量轻、柔软性好、成本较低、可显示范围宽等优点,在当今的有机显示和照明等领域发挥着越来越重要的作用,吸引了社会各界的关注。与此同
“一带一路”倡议是我国基于当今世界发展大势,既结合国内实际情况又放眼于国际大局提出的重大发展战略。它是站在实现中华民族伟大、复兴、富强的高度基础上实现的。《“一带一路”年度报告:智慧对接(2018)》由2018年商务印书馆有限公司正式出版,从宏观建议、领域思考到企业案例提供的一带一路经验,全方位解读了“一带一路”倡议。本报告基于书中的总报告《“一带一路”:从“宽广之路”到“大道之行”》英译实践撰写