【摘 要】
:
篇章级情感分析一直是自然语言处理中最活跃的研究领域之一。它在数据挖掘、文本挖掘舆情研究、和信息检索中也有着很高的出场率。事实上,由于它对商业和整个社会舆情研究的重要性,它已经从计算机科学延伸到管理科学和社会科学,如新闻传播、营销策划、金融分析、政治科学,甚至历史研究。因此,收集和研究情感意见已成为必要。本文具体内容如下:1、篇章级情感分析的关键在于是否能够准确有效的生成文本的情感表示,然而现有的模
论文部分内容阅读
篇章级情感分析一直是自然语言处理中最活跃的研究领域之一。它在数据挖掘、文本挖掘舆情研究、和信息检索中也有着很高的出场率。事实上,由于它对商业和整个社会舆情研究的重要性,它已经从计算机科学延伸到管理科学和社会科学,如新闻传播、营销策划、金融分析、政治科学,甚至历史研究。因此,收集和研究情感意见已成为必要。本文具体内容如下:1、篇章级情感分析的关键在于是否能够准确有效的生成文本的情感表示,然而现有的模型大多只是考虑从词级对文本进行编码。文中提出了一种基于多尺度卷积和门控机制的注意力情感分析模型,使用多尺度卷积的文本数据编码方式捕获不同粒度的局部相关性,以得到更多不同层次的文本语义信息,形成更丰富的文本表示。该模型还考虑到用户个性及产品信息对文本情感分类的影响,将范畴信息(用户信息和产品信息)融合到注意力中捕捉与用户和产品相关度较高的关键语义成分生成文档表示。并且引入门控机制控制情感信息流向汇集层的路径,最后使用全连接层和argmax函数实现情感分类。通过在公开的IMDB,Yelp2013和Yelp2014篇章级情感分析数据集上进行实验,验证了模型的有效性。2、在多尺度卷积和门控机制的注意力情感分析模型基础上,考虑如何更有效地使用用户产品信息,提出基于用户偏好信息和产品特征信息的门控注意力模型。文档中有些词显示出强烈的用户偏好,有的更倾向于表明产品的特征,可见将用户信息和产品信息一起编码到一个表示中是不合理的。提出使用门控的方式来融合用户和产品信息到模型中。首先,应用两个独立的注意力分别生成基于用户偏好和产品特征的文档表示。然后,将这两个评论表示加权求和作为最终的表示,并且经过一个门控单元。最后使用线性分类预测用户对一个产品的总体情绪实现情感分类。还对融合范畴信息到不同位置进行尝试。通过实验证明,同时将用户产品信息融合到嵌入层和注意力中拥有更好的情感分类效果。
其他文献
行李托运服务是民航运输服务中的重要组成部分,乘客的行李分为随身行李和托运行李。随着托运行李数量的逐年攀升,传统基于人工的托运行李处理方法的弊端开始显现(暴力分拣、行李计数遗漏等)。因此,本文提出了基于目标检测和跟踪的托运行李计数方法和暴力分拣检测方法以帮助规范机场作业流程。本论文基于YOLOv3目标检测算法,建立针对托运行李的目标检测模型,使用目标跟踪算法SORT,解决托运行李检测中目标的稳健检测
目的:既往报道MUC16可以影响胚胎的种植,但是目前MUC16在孕早期的作用尚不清楚。NK细胞是孕早期蜕膜中主要的免疫细胞,Siglec-9受体是NK细胞上与MUC16相互结合的重要的免疫抑制性受体。本文主要探索MUC16通过NK细胞对滋养细胞迁移能力和血管内皮细胞血管新生能力的调节作用。方法:1.收集并比较正常生育力女性胚胎移植后20天,35天和50天的外周血中MUC16的表达水平。2.收集正常
背景:随着全球范围内新型冠状病毒肺炎(COVID-19)病例持续增长与医疗资源短缺之间的不平衡日渐显著,世界卫生组织建议诊断为轻型和普通型(非重症)的患者在家或社区医疗机构进行自我隔离,且患者可以在症状缓解后解除隔离,无需再次进行病毒核酸检测。但是,患者在病毒未完全清除的情况下提前解除隔离会存在传播病毒的风险。本研究旨在探索非重症COVID-19患者的外周血中与病毒核酸转阴时长相关的因素,并以此为
背景:抗程序性细胞死亡蛋白-1(programmed cell death protein-1,PD-1)单抗显著改善了晚期非小细胞肺癌(non-small cell lung cancer,NSCLC)患者的预后。但是,目前临床上缺乏简便可靠的预测标志物。本研究旨在探究NSCLC患者的临床特征和外周血实验室指标与PD-1单抗治疗疗效及生存的相关性,并以此为基础建立相应的预测模型。方法:本研究回顾
随着计算机技术的爆炸性发展,信息系统的结构复杂度呈指数型增长,信息系统包含子系统的数量增多,子系统中业务功能的数量增加,造成信息系统的稳定性大幅下降。发生信息安全事件或者意外情况时,业务功能的中断在系统中极易形成连锁反应,导致其他业务功能相继失效最终波及影响到整个信息系统。在实际应用场景中,具备应急预案以及灾后快速恢复能力成为信息系统不可或缺的要素。对于复杂程度高、子系统繁多、业务间耦合程度高的信
信息技术的进步与发展推动了数字社会的建设,智能设备与应用软件已经成为生产生活中不可缺少的部分,随之而来的是它们所产生的海量数据,如何利用这些数据并从中获取价值是当下所面临的一个新技术挑战。复杂事件处理是一种面向流式数据的处理理念与技术框架,它关注数据间的相互关系,能够实时处理多源异构数据,以领域知识与历史数据为模板,检测数据流中特殊的数据组合模式。因此复杂事件处理技术在决策分析、交通管理、集群监控
背景:急性肺损伤(acute lung injury,ALI)是一种临床急危重症,严重影响患者的生存率,探索治疗急性肺损伤的有效方法一直是该领域的研究热点。有关急性肺损伤的治疗虽有许多研究,但目前仍无特效的治疗药物和方法。细胞周期依赖性激酶(cyclin-dependent kinase,CDK)在细胞增殖、分化、基因转录、功能调节方面起着极其重要的作用。近年来,研究发现,CDK抑制剂可以缓解炎症
航班过站时间是由多个航班过站关键节点构成,影响因素众多,对航班过站时间的准确预估能够在航班延误发生后对下一班的航班离港时间作出正确判断,而对航班过站时间进行准确预估的前提,是对航班过站数据进行特征选择,找到影响航班过站关键节点时间的重要特征子集,分析多维航班数据与航班过站关键节点时间的关系。当下航班过站数据特征选择普遍采用传统的数据统计方法,然而航班过站关键节点时间影响因素复杂,采用传统方法筛选特
背景:重复性经颅磁刺激(repetitive transcranial magnetic stimulation,rTMS)是一种非侵入性治疗慢性神经病理性疼痛(neuropathic pain,NP)的治疗方法,通常以大脑初级运动皮层(primary motor cortex,M1)为作用靶点。然而,关于rTMS治疗的最佳参数(治疗次数、刺激频率)以及能否实现长期镇痛效果仍存在争议。本研究的目的
随着民航强国战略的提出,我国民航运输行业进入了发展的机遇期。《2020年民航行业发展统计公报》显示:2020年,我国运输总周转量接近800亿吨公里,旅客周转量突破6310亿人公里,旅客运输量达到4.18亿人次。持续增长的航空运输量导致空中交通管制压力增大,也对机场场面监视能力提出了更高要求。在视频采集等硬件部署基础上,实现对机场场面飞机目标的智能识别与跟踪,具有重要的应用价值。本文提出了一种基于深