面向复杂文本的中文开放关系抽取研究

来源 :西南科技大学 | 被引量 : 0次 | 上传用户：shiqiuqiu100

【摘要】

：

【作者】

：

熊建华

【机构】

：

西南科技大学

【出处】

：

西南科技大学

【发表日期】

：

2023年01期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

开放关系抽取能在不预设关系词表的情况下,对语料进行灵活的关系抽取,快速对知识进行有效的组织、整理。然而开放关系抽取的语料通常包含大量结构复杂的文本。现有的开放关系抽取方法在抽取这类复杂文本时,效果较差,主要存在如下问题。一是句子结构复杂,难以分析出准确的句法分析结果为开放关系抽取提供数据支持。二是复杂文本中的实体词通常是由多个词语构成的名词短语,识别难度较大。三是复杂文本存在关系重叠的现象,以往的抽取方法难以完整抽取出所有的关系数据。针对以上问题,本文提出了基于长句简化的开放关系抽取和基于多任务学习的开放关系联合抽取两种优化方法,提高对复杂文本的开放关系抽取性能。主要研究内容如下:（1）提出一种基于长句简化的开放关系抽取方法。该方法首先利用序列到序列模型对复杂长句进行简化,然后按照基于规则模板的抽取方法对简化后的句子进行关系抽取。在关系抽取过程中,首先根据词性信息的启发式规则,对实体进行识别,然后利用句法分析结果,对化简后的子句设计专门的抽取规则。（2）提出了一种基于多任务学习的开放关系联合抽取方法。该方法利用序列到序列模型对复杂文本直接进行开放关系联合抽取。通过一种特殊的关系序列表示方法对多关系数据进行序列转化,然后基于序列标注和特殊掩码机制,实现对实体标签预测和关系抽取的多任务学习。最后根据预测的标签引导模型生成关系数据中的实体。（3）构建了示温漆研制过程知识库。首先根据领域专家意见,从涂料专业参考书和国内期刊中收集示温漆研制过程知识语料。然后根据本文提出的开放关系抽取方法对示温漆研制知识的关系数据进行了抽取。最后根据抽取出的关系数据和整理的词条数据,构建了领域知识库,并对其进行了可视化展示。

其他文献

中国和吉国贸易中跨境电子商务发展研究

中国和吉国的合作近年来突飞猛进,随着网络技术的进步与发展,跨境电商逐步发展为中吉两国开展经贸合作的一种重要方式。文章以中吉两国贸易中跨境电商的发展研究为例,搜集中吉两国经贸合作相关数据,对中吉两国经贸合作、跨境电商合作现阶段的情况进行探讨,深入剖析当前中吉两国跨境电商合作的发展问题,并对两国跨境电商发展的前景进行预判分析。通过研究,文章总结了以下结论:第一、在双边经贸合作上,中吉两国的合作成效不断

学位

遂宁董家巷夜间经济区项目运营管理研究

当前,夜间经济正在快速发展,我国国务院办公厅于2019年8月底发布了《关于加快发展流通促进商业消费的意见》[1],文件指出我国要加快夜间经济的建设和发展,以此发展活跃的夜间市场,这是对我国夜间经济既往发展情况以及当前国情现实的综合考量提出的重要意见,对于夜间经济在我国的发展以及推动经济整体发展具有重要的促进作用。四川省省政府于2020年4月初发布了《四川省商务厅关于做好激发消费潜力稳定经济增长工作

学位

面向三维流场可视化的沉浸式手势交互研究与应用

近年来,随着多款商用级头戴式显示器的推出,沉浸式技术的应用研究有了快速的发展。在沉浸式环境下,可以提供与真实环境相似的交互体验,增加使用者的临场感与沉浸感。沉浸式技术拥有直观的立体显示效果和三维交互方式,与游戏、工业设计、考古、医学、电影等领域的三维虚拟场景高度契合,得到了广泛的应用。三维流场亦是沉浸式技术应用的一个重要领域。在流场可视化过程中,经常需要对三维参数进行配置,如流线布种,区域剪切等。

学位

复杂场景下的人群计数方法研究

人群计数旨在估计出视频或图像中的人数,在公共安全预防、产品投放等方面有着广泛应用。随着深度学习的发展,使用卷积神经网络对人群计数进行研究可以有效提升人群计数的准确度。然而在现实生活的复杂场景中,人群计数算法面临着许多挑战,如人群的尺度变化、复杂背景等。捕获多尺度特征并减弱背景干扰是降低人群计数误差的关键。因此,本文在详细分析基于深度学习的人群计数算法的基础上,对人群计数算法中的网络结构与损失函数部

学位

交通轨迹不确定性可视分析研究

交通轨迹是交通工具在时间区间内的空间移动路径,反应交通工具的时空特征。探索交通轨迹数据是分析轨迹数据特征的重要步骤。交通轨迹数据是一种时空数据,具有数据量大、时间跨度长的特点,这使得现有的交通轨迹数据探索方法技术门槛高。交通的随机性使得交通轨迹充满不确定性,这将不利于交通轨迹数据的进一步利用。可视化通过直观的视觉通道传达交通轨迹信息,具有直观高效的特点。因此,通过可视化研究交通轨迹不确定性相关问题

学位

深度学习图像质量评估算法在文本合成图像工作中优化作用的研究

图像生成指计算机通过人工智能领域的相关算法,自主产生和真实图片相近的生成图片。其在计算机视觉领域有着重要的地位,主要用于计算机辅助设计、图像编辑、艺术设计、信息转换等领域。然而,目前多数生成图像的实际使用并不普遍,这主要是因为生成图像的质量较低,与真实图片比有较大的差距,特别是在复杂图片的生成任务中,这个缺陷会进一步放大,这使得生成图片难以投入实际的使用。为了进一步提升生成图片的质量,一套合理的质

学位

基于生成对抗网络的不规则退化图像修复

图像修复是指将图像缺失内容进行重建的一个过程,其主要手段是通过退化图像中还能够获取到的语义信息、纹理信息、结构信息等进行缺失区域的语义预测、纹理预测、结构预测。最后使填充的结果与图像未丢失部分保持相同的风格,连贯的内容。并且,修复结果需要人眼看起来真实,自然。传统的图像修复方法在解决一些简单的小面积缺失区域图像时,修复结果尚可,但是由于其本身的限制,在修复复杂图像、大面积缺失图像时,往往得不到令人

学位

大型构筑物损伤缺陷视觉检测关键技术研究

随着基建技术的发展,越来越多的大型构筑物被投入使用,并且伴随着使用年限的增长及使用过程中的疲劳使用和自然灾害等一系列因素,造成构筑物表面或多或少的会出现一些损伤,传统检测手段往往是利用人工完成,对工人的人身安全有着极大的考验,并且还存在部分大型构筑物的巡检部位人工很难到达,因此现代化、智能化检测方式的需求变得日益迫切。本文以数字图象为基础,研究构筑物表面损伤检测技术,利用深度学习方法实现构筑物表面

学位

基于深度学习的全景分割研究

近年来,深度学习技术的快速发展为图像处理带来了新的机遇,特别是在图像分割、图像识别、图像理解等方面。图像分割是将图像中边缘、区域等特征提取出来,支撑图像处理下游任务,在学术界和工业界受到广泛关注。全景分割融合了图像分割的语义分割与实例分割结果,在图像深入理解场景,如视频监控、自动驾驶、医学图像诊断等发挥了重要作用。全景分割完成对图中的所有物体的背景进行检测与分割,主要分为特征提取、语义与实例分割、

学位

面向节点分类的图表示学习算法研究

图表示学习将图中节点从高维、稀疏的网络空间映射到低维、稠密的向量空间,映射过程中保持原始的网络结构并支持图推理。通过图嵌入得到的向量规范性更强,可直接作为下游如节点分类、链接预测或可视化等机器学习任务的输入。图表示学习在链接预测任务上效果良好,但在节点分类任务中表现不佳,这是由于节点类别通常与领域内节点的拓扑结构、重要性特征、属性特征及其类别标签信息密切相关。针对节点分类的图表示学习做了如下研究:

学位

面向复杂文本的中文开放关系抽取研究

其他学术论文