【摘 要】
:
近年来,随着自然语言处理技术的快速发展,聚焦于词级、短语级的研究已取得显著进展,针对于句子级的语义分析任务还相对较少,因此侧重于理解句子语义的篇章句间关系识别任务得到了研究者们的广泛关注。该任务作为篇章语义分析中的一项核心任务,旨在研究篇章内部论述单元(简称为“论元”)的逻辑语义关系,如因果关系、比较关系等。如何更准确的挖掘论元的深层语义信息是研究该任务的关键,也是影响模型性能的主要因素。本文主要
论文部分内容阅读
近年来,随着自然语言处理技术的快速发展,聚焦于词级、短语级的研究已取得显著进展,针对于句子级的语义分析任务还相对较少,因此侧重于理解句子语义的篇章句间关系识别任务得到了研究者们的广泛关注。该任务作为篇章语义分析中的一项核心任务,旨在研究篇章内部论述单元(简称为“论元”)的逻辑语义关系,如因果关系、比较关系等。如何更准确的挖掘论元的深层语义信息是研究该任务的关键,也是影响模型性能的主要因素。本文主要针对中文篇章句间关系的识别方法展开研究,主要研究内容如下:(1)融合BERT和CNN的句间关系识别现有神经网络模型一般使用预训练好的词向量表作为嵌入层,无法表征相同词语在不同语境中的不同含义;另外,通过Bi LSTM编码论元信息考虑了上下文中词语之间的关联性,但没有充分提取论元的深层次特征。针对以上问题,本文使用BERT字向量替代传统的词向量表,其可以根据不同的上下文语境表征字的多义性;并融合CNN以提取论元更深层次的局部特征,进行句间关系识别。(2)基于注意力机制的句间关系识别通过Bi LSTM编码论元得到的句子向量中每个词都具有相同的权重,然而每个词对于句子的作用不尽相同,因此本文引入多头注意力机制使得模型能够充分关注论元中的重要信息并对其赋予更高的权重,用以从不同的子空间表征中获取更多层面的特征;另外,两个论元之间存在一定的关联性,并不相互独立,因此本文引入交互注意力机制捕捉两个论元之间的关联信息,充分融合两个论元的语义信息。(3)句间关系识别模型的构建根据上述识别方法,本文构建了Bi LSTM、BERT-Bi LSTM、BERT-Bi LSTM-CNN、BERT-Bi LSTM-MHA、BERT-Bi LSTM-IA 5种句间关系识别模型,并使用哈工大中文篇章关系语料(HIT-CDTB)进行了测试,实验结果证明了本文方法的有效性。
其他文献
中国是世界上老龄化较严重的国家之一,脑小血管病是临床常见的在老年人群中易发的脑部血管病,其临床表现多样,可表现为认知功能下降、痴呆、步态异常、情感障碍等.如不对其干预,任其发展下去,极易引发语言功能、认知功能等多种脑功能障碍,导致患者精神恍惚及生活自理能力下降,不仅使患者感到痛苦,对社会对家庭都是一种负担.脑小血管病初期通常症状不明显,容易被患者及其家属忽略而错过早期识别、及时治疗的最佳时期.脑小
分类是数据挖掘领域中一个重要的分支,普通的分类模型通常假设数据集中各类别的样本数量差距很小且对于每个类别的误分代价相等,而使用不平衡数据集训练传统的分类器会导致模型对于少数类的预测精度很低,因此不平衡数据的分类问题一直是机器学习领域的研究热点。本文针对面向不平衡数据的分类方法开展研究,引入了基于样本权值的欠采样方法,样本局部密度计算方法以及样本误分代价计算方法,提出了三种面向不平衡数据的AdaBo
机器学习通过学习样本数据、进行模型拟合或者预测推理等方法,使其在数据集中自动获取相应的理论,从而形成一种与常规方法互补且具备可行性的算法,其主要适用于缺乏一般性理论及规模较大的数据集中。物理学可以用来探究物质运动的规律,随着物理学研究的不断发展与进步,机器学习算法也成为了研究物理学问题的热门算法。该学科虽与机器学习处于两个不同专业领域,但其在处理问题的思想上存在诸多共通之处。因此,可通过机器学习来
当下,人们生活中的衣食住行都向着智能的方向改进,而这一切都离不开对数据信息的挖掘。智能的生活方式产生了海量数据,数据挖掘就是从大量数据中发现其中潜在信息的过程。在数据挖掘领域中,高维数据导致的维度灾难和数据过拟合是困扰研究人员的两大问题。特征选择是一个重要的数据预处理步骤,通过从候选特征集中挑选出重要的特征组成新特征子集,利用该子集进行模型训练等学习任务。进行特征选择可以有效地克服维度灾难问题,缓
目前,越来越多的计算机视觉系统被广泛应用于各个行业,这些计算机视觉系统大都以输入清晰图像为前提进行工作,但是在实际场景中,特别是在室外环境下,由于雾、霆等天气原因,我们无法保证获取到清晰可用的图像数据,因此图像增强技术越来越受到研究人员的关注。应用水下机器人进行水下探测是一项重要任务,而计算机视觉技术是完成这项任务的关键环节。但是光的吸收和散射现象同样存在于水下环境中,比起有雾图像,水下图像会遭受
随着5G、互联网、云计算以及其他技术的迅速发展,网络环境日益复杂,且攻击形式日益多样化,也为网络空间安全带来了严峻的考验。网络入侵检测技术采用一种主动防御方式来维护网络的安全,为网络提供实时的监控与动态的保护。面对海量的网络数据,现有的入侵检测模型不仅无法有效处理这些高维且复杂的数据,也难以识别数据样本较少的攻击类型,且模型检测效率低、识别率较差。基于上述问题,本文提出了基于PGoogLeNet-
近年来,随着物联网迅速发展,射频识别技术(RFID,Radio Frequency Identification)被广泛应用于物流追踪、身份识别与国防军事等多个领域。目前,由于有芯片RFID传感器标签制作成本较高,所以设计低成本的无芯片RFID(Chipless RFID)传感器标签成为现今研究热点。本文针对无芯片RFID传感器标签的抗杂波性能进行研究与设计,具体从传感器标签的结构设计、极化转换特
网络资产是指连接到互联网的网络设备、安全设备、中间件、服务器、个人计算机等设备的类型和版本、操作系统类型、IP地址、开放端口及端口服务等信息。对网络资产进行探测和管理既可以帮助企业网络资产管理人员清楚地了解企业内部拥有的网络资产,又可以作为渗透测试人员或黑客开始工作前的信息收集,因此,对各种网络资产信息进行有效探测是必不可少的。其中,操作系统是各种设备运行的基础,当前市面上的操作系统类型众多,而现
近年来随着信息技术的快速发展和数据获取方式的不断丰富,人们对于图像视频类数据的处理需求也越来越多,目标跟踪作为图像视频类数据处理的重要技术,与之相关的研究也变得异常火热。从基于传统计算机视觉技术的相关滤波算法到基于深度学习跟踪模型的出现,跟踪算法的性能得到大幅提升。但是,在目标跟踪领域始终面临着多方面的挑战,如:复杂的背景、光照变化、目标物被遮挡以及运动物体的旋转尺度变化等,严重影响现有目标跟踪算
在互联网信息技术普及的21世纪,流行媒介作为现代化生活直接有效的信息传播方式,形成以数字媒介为主体的发展趋势。它丰富的图像语言以及广泛的视觉传播性得到了大众的认可。抽象立体形态的图像语言借助媒介反映了人们追求时尚理念与情感表达的诉求。笔者尝试和运用抽象立体形态语言进行创作,展现客观物体的三维形态,本研究以基础理论作为支撑,在C4D软件技术背景的支持下,将传统文化形象最终以抽象立体的形态语言呈现出来