【摘 要】
:
人们经常在博客、论坛、在线评论、电子商务平台等社会媒体中对于某些事物表达个人观点、态度和情感,这些评论是准消费者决断的重要资源,也是产品或服务提供者汲取意见的重要
论文部分内容阅读
人们经常在博客、论坛、在线评论、电子商务平台等社会媒体中对于某些事物表达个人观点、态度和情感,这些评论是准消费者决断的重要资源,也是产品或服务提供者汲取意见的重要依据。本文针对大规模产品评论文本进行细粒度的情感分析研究,旨在有效抽取出评论文本中的显式和隐式的评价对象、观点词并进一步判断出用户表达的情感,本文提出一种基于多任务联合学习方式捕获不同任务间的语义关联信息,有效地提高了系统识别地准确率。这种细粒度的属性级情感分析研究对情感分析任务具有重要的学术价值和应用价值。本文主要研究工作如下:1.基于改进记忆网络的属性级情感极性分类方法。记忆网络在解决面向评价对象的情感分类时,只关注了词级简单语义,且忽略了序列自身语义信息。本文提出使用卷积多头自注意模块提取记忆,再用评价对象的向量表示做多跳注意力计算,从而弥补了记忆网络存在的缺陷。在Sem Eval-2014 Restaurant(AT)、Sem Eval-2014 Laptop、Sem Eval-2014 Restaurant(AC)、Sem Eval-2016 Tweet四个数据集上超过所有基线方法达到最优,准确率分别提高了3.10%,2.91%,1.83%,2.02%。面向评价对象的情感极性分类的前置任务是评价对象识别,包括属性词的抽取和属性类的识别,本文分别使用序列标注模型和联合学习的多标签二分类模型对属性词抽取和属性类识别的方法进行了研究。2.基于多任务联合学习模型的属性级情感分析方法。以往大部分研究方法将评价对象的识别及其情感分析作为独立的任务研究,而在应用需求的驱动下往往需要并行任务的结果。流水线处理方式会导致错误累积,且不能学习到一些跨任务的重要关联信息。本文提出了一种相关子任务的联合解决方案,一站式解决应用需求的多个任务。具体包括属性类和属性词的同时识别;属性类及其情感极性的同时判断;属性词及其情感极性的同时抽取三个方面。本文的研究重点在于同时解决不同任务,并利用任务间关联信息提高各个任务的性能。实验结果表明,我们的方法在Sem Eval-2014 Laptop数据集上超过所有基线系统达到最优,在属性词抽取任务上F1值比基线方法高了0.54%,在属性词及其情感极性判断任务上F1值提高了0.28%。3.融入观点词信息的属性级情感分析方法。属性级情感分析中,人们主要关注评价对象及其情感,而观点词(opinion terms)也是重要的情感要素。观点词和属性词之间可能存在相互依赖的句法关系;而观点词又是判断情感表达的重要依据。本文提出了一种属性词和观点词抽取及属性词的情感极性判断的一站式解决办法,利用三个任务间的依赖关系,试图提高各个任务的性能。在Sem Eval-2014Laptop、Sem Eval-2014 Restaurant、Sem Eval-2015 Restaurant三个数据集的观点词抽取任务上达到最优,F1值比基线模型分别提高了3.49%,0.81%,3.26%;在Laptop数据集的属性词及其情感极性判断任务上提高了2.42%。
其他文献
目的:基于慢病管理及中医治未病理念开发针对EB病毒潜伏感染人群的慢病管理移动医疗应用,并调查广州地区EB病毒的感染情况,建立体质、证候等中医电子数据库,分析其中医特点及发展规律。以期进一步了解EB病毒潜伏感染的发生、发展过程,提升EB病毒慢病管理方案的有效性和便捷性,从而降低EB病毒感染率,最终达到降低EB病毒相关恶性肿瘤发病率的目的。方法:选择2018年1月-2018年12月在广东省中医院门诊部
随着社会的发展,人民对健康的要求逐步提高,就诊人数日益增多,而同时我国医疗资源严重紧缺,医疗运营部门尚未形成成熟的管理体系,导致了我国“看病难”、医患关系紧张的现状
随着我国“智慧消防”工作的不断推进,要实现“智慧消防”中关于智慧感知、智慧防控和智慧管理的需求,对于火灾风险的精准研判与实时监测至关重要。但目前我国火灾风险评估面临的火灾基础信息累积不足、火灾数据分析不彻底、时效性不强等问题,难以满足当前“智慧消防”工作需求。2008年,Google经研究发现,流感相关关键词搜索量与实际患有流感症状的人数之间存在着密切关系,并根据此相关关系构建了流感趋势在线预警系
巨噬细胞(Macrophage,Mφ)是介导固有免疫和获得性免疫的重要桥梁,在阻止和清除病原体入侵机体中发挥重要作用。Mφ也是某些胞内致病菌(如沙门菌)的庇护场所,致病菌可借助Mφ逃避宿主的免疫防御。乳酸菌(lactic acid bacteria,LAB),作为益生菌的重要代表,因其特有的定植位置和益生功能,在活化Mφ、树突状细胞(DC)等抗原递呈细胞方面发挥了重要作用。因此,常用于预防肠道病原
随着互联网的普及以及地理位置定位技术的成熟,使基于位置的社交网络(Location-based social networks,LBSN)推荐服务成为现实。加之经济的发展,旅游被越来越多人所青睐,基于
爱德华·阿尔比是美国二十世纪60年代最重要的剧作家,他的作品主要关于现代社会中的背叛与遗弃、幻想与现实和存在主义危机等议题。《谁害怕弗吉尼亚沃尔夫?》是阿尔比的代表作品,自问世以来,学者们已从很多角度进行了解读,比如精神分析,美国梦,女性主义以及荒诞性,并且国内学者也另辟蹊径,从新历史主义,狂欢理论和空间理论等视角进行解读。然后,尽管对该剧的研究成果颇多,但是基于游戏理论的研究几乎微乎其微。论文主
命名实体识别是自然语言处理领域的核心基础性任务之一,其任务是从文本中提取特定类型的实体。在信息检索、问答系统、信息抽取、文本挖掘、舆情分析等下游自然语言处理任务
域F上迹为零的n阶矩阵A有很多特殊性质,其中有一条是,A可以成为线性空间Mn(F)上的换位子,即存在P,Q ∈Mn(F),使A=[P,Q]=PQ-QP.如果再加上A是非标量矩阵这一个条件,则A还可以和域F上的一个零对角矩阵相似.本文考虑用高斯整数环Z[i]替换数域F,发现迹为零的矩阵能成为换位子这条性质仍然是成立的.当n>2时,若对于任意高斯整数a,和高斯整数环上任意素数p,都有A(?)aI
任何学科都应建立在理论系统和用于阐释相应理论的术语系统的基础之上。本文是基于对术语学专著进行翻译分析,了解术语学专著的语言特点,掌握翻译术语学资料的基本原则,总结术语学翻译的基本经验。笔者针对所翻译的前言和绪论部分,分析了原材料的语言特点。总结术语学的文本语言特点。对词汇(术语、复合前置词、同义词等)进行翻译案例实例分析。对句子(形动词短语、被动结构形式、长难句)进行汉译实例分析,分析过程中运用了
徽州文書數量龐大,具有真實性、民間性、典型性、連續性等特徵。具體内容包括土地買賣、分家書、合同議墨、婚喪、訴狀、遺囑、書信、賬簿等。其中合同文書格式化程度较低,且發展至清代雙音詞類型豐富多變,語料價值較高,故以此爲研究對象作深入研究。研究共分作四個部分:緒論主要介紹徽州文書的收集整理情況、語料價值、研究對象、研究現狀及研究方法。目前,徽州文書在語言文字方面的研究較爲薄弱,且對其中某類文書的雙音詞進