基于句子顺序与多表标注的情感分析方法研究

来源 :中国民航大学 | 被引量 : 0次 | 上传用户:iamasg_wql
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社交媒体的迅速普及,大量关于表达个人或组织的情绪、意见和态度的文本数据出现在了网络中,这些文本包含的丰富情感信息对个人、组织或者国家都具有重要意义。情感分析起初的研究以基于规则的方法为主,但鉴于问题本身的复杂性及人工智能技术应用的普及,基于机器学习的情感分析方法已成为目前主流的研究方法。情感-原因对提取任务和面向方面的细粒度意见抽取任务是情感分析中两个比较困难的任务,也是本文研究的目标。情感-原因对提取任务作为句子级情感分析任务,旨在提取文档中的情感子句和相关的原因子句。尽管现有方法已取得较好结果,但大多数方法都忽略了情感子句与原因子句的顺序信息,且部分方法存在重视情感信息,忽视原因信息倾向。为了捕获顺序信息并且使其在模型中发挥帮助作用,本文提出了一个基于句子顺序引导的深度预测模型,该模型中包含三层不同方向的LSTM网络以获取三种句子顺序信息。另外为了减少模型过于注意情感信息而忽视原因信息的问题,设计了两个并行的词编码器来分别学习情感信息与原因信息。在公开的英文与中文数据及上的实验结果表明,考虑句子顺序特征的方法能有效提升情感-原因对提取的效果。面向方面的细粒度意见抽取任务作为方面级情感分析任务综合性最高的任务之一,旨在从句子中提取成对(方面项、意见项)或意见三元组(方面项、意见项、情感极性)。然而,现有的方法主要针对单词进行编码,忽略了词组项信息。另外,由于解码阶段不区分单词和词组,导致句子中是词组的方面项和意见项的提取效果不佳。为了在不影响单词信息的情况下获取词组信息,本文基于单一表格标记方法设计了一种针对词组的多重表格标记方法。该方法首先需要通过单词表示得到词组表示,并且分别对单词和词组表示组成的表格进行标注,最终综合两个两个表格的标注结果作为最终结果。在四个数据集上的实验结果验证了考虑词组信息的方法是有效的。
其他文献
随着计算设备的快速发展和深度学习领域的不断创新,深度学习及其相关方法在学术领域和工业领域都得到了大范围应用并取得了优秀的成效。同样在计算机视觉领域,特别是目标检测领域,深度学习及其相关方法取得了前所未有的成就。与基于传统算法的目标检测方法相比较,基于深度学习的目标检测方法在准确率、召回率和鲁棒性上有着更优秀的表现。然而,常见的裂缝、眼底视网膜血管、遥感图像中的道路等不规则细小目标有别于常规目标,其
学位
随着计算机技术的飞速发展,信息过载已经成为人们当前网络生活的一大阻碍。推荐算法是当前应对信息过载的重要手段。传统的推荐算法有着诸多问题,例如冷启动、数据稀疏等。随着神经网络、深度学习等算法的广泛应用,将时序交互信息与动态图神经网络结合已成为当前推荐系统研究的一大热点。过去研究者提出了一些基于用户项目交互历史的动态图算法,但是这些方算法只考虑了交互中所涉及到节点的演化更新,没有考虑交互过程对邻居节点
学位
目的:建立奥沙利铂(Oxaliplatin,L-OHP)耐药的人结肠癌细胞株,为探索人结肠癌细胞L-OHP耐药相关的分子机制奠定基础。筛选并鉴定耐药细胞差异表达的微小RNA(miRNAs)。探索差异最显著的miR-302a-3p对人结肠癌细胞L-OHP耐药的作用及其机制。方法:采用药物浓度梯度递增持续诱导法建立L-OHP耐药的人结肠癌细胞株(LoVo/L-OHP细胞株),用CCK-8实验检测细胞对
学位
面向机坪目标检测的应用大多在监控视频上进行,面临着巨大的存储压力和计算开销,海量的图像数据对视频处理和分析方法提出了更高的要求。目前一般采用大型的云服务器集群对机坪监控视频进行目标检测,需要高速的网络带宽并且配备强大的图形处理器(Graphic Processing Unit,GPU)提供计算支持。然而未来的趋势是提高嵌入式设备的智能处理能力,以取代昂贵的GPU设备,提高检测效率,减少资源开销。因
学位
航班旅客订座量预测在航空公司收益管理、航线网络优化、飞行计划编排、地面作业服务等关键业务中都有重要应用,但是,由于航班订座量数据较大的离散性,订座量的预测一直是困扰航空公司实践业务的核心问题之一。本文以国内某航空公司国内航线动态定价系统开发的设计与实现为背景,重点研究其中的预测算法及其软件实现。首先,在分析航班旅客订座量数据特点的基础上,提出在星期特性(DOW)之外增加时季特性(HML)的数据分类
学位
航班需求预测是对未来航班的座位需求量进行预测,能够有力支撑航空公司做好今后的舱位分配、座位数量控制以及机票超售等工作,是航空公司收益管理的基础。目前的航班需求预测方法是根据某类影响因素和航班需求的关系建立预测模型,或者是使用历史航班需求建立时间序列模型进行预测。以上做法仅考虑了某一类因素对航班需求的影响,忽略了航班需求受到多类因素的共同影响,导致预测结果没有达到预期效果。由于航班需求受航班、日期、
学位
目的:卵巢癌是女性生殖道肿瘤中死亡率最高的恶性肿瘤,化疗耐药是卵巢癌治疗失败的重要原因之一。研究显示,脂肪酸合成异常在许多肿瘤的发生发展及耐药中起着重要作用,但其在卵巢癌耐药中的作用尚不明确。本研究旨在探究脂肪酸合成异常在卵巢癌紫杉醇耐药中的作用,并探讨脂肪抑制素与紫杉醇联合应用对卵巢癌紫杉醇耐药细胞的抗肿瘤作用。方法:首先,我们检测了正常卵巢组织和卵巢癌组织中脂滴及脂肪酸合成关键酶的表达情况,并
学位
背景:心肌功能障碍是严重脓毒症和脓毒症休克病人的主要并发症之一,称为脓毒症诱导的心肌功能障碍(Sepsis induced myocardial dysfunction,SIMD)。然而,针对SIMD的治疗,目前有效的策略依然十分有限。整合素β1是心肌细胞上主要的整合素亚单位,其主要功能是将机械信号转化为生物化学信号。我们此前发现整合素β1表达异常与大鼠脓毒症心肌功能障碍有关,本研究旨在探索整合素
学位
近年来,由于互联网和信息技术的进步,网络信息技术被广泛应用到各个领域。网络信息技术推动社会经济发展的前提是网络信息安全,其中计算机软件安全更是网络信息安全的重要一环,因此对软件源代码进行漏洞检测具有重要的现实意义。随着软件功能和开发技术的复杂化,传统漏洞检测方法存在源代码表征方式单一、泛化能力差、检测效果不佳等问题。为解决上述问题,本文对源代码特征提取方法、深度学习技术进行详细分析,并论述深度学习
学位
目的:探讨经颅多普勒超声(TCD)对脓毒症患者脑循环及脑功能的动态评估和预后预测价值,以及对脓毒症相关性脑病(SAE)的早期诊断价值。方法:选择2017年1月至2018年6月在我院住院的脓毒症患者,排除其他可导致脑病的情况。所有患者给予常规治疗,并在入院第1天和第3天接受TCD检查。收集患者年龄、性别、平均动脉压(MAP)、超敏C反应蛋白(Hs CRP)、血PH、血PCO2、血乳酸、白细胞计数、感
学位