【摘 要】
:
无结构化文本中蕴含丰富的命名实体以及关系信息,如何快速且准确地从文本中抽取这些语义信息是自然语言处理领域的基础任务,可以为知识图谱构建、信息检索等下游任务提供数据支撑。联合实体关系抽取旨在从文本中同时抽取所蕴含的实体关系三元组,因其较好解决了流水线框架存在的错误传播和忽视任务依赖问题,已受到研究人员广泛关注。目前联合实体关系抽取研究主要存在以下挑战:(1)长距离实体关系难以识别。由于梯度消失等问题
论文部分内容阅读
无结构化文本中蕴含丰富的命名实体以及关系信息,如何快速且准确地从文本中抽取这些语义信息是自然语言处理领域的基础任务,可以为知识图谱构建、信息检索等下游任务提供数据支撑。联合实体关系抽取旨在从文本中同时抽取所蕴含的实体关系三元组,因其较好解决了流水线框架存在的错误传播和忽视任务依赖问题,已受到研究人员广泛关注。目前联合实体关系抽取研究主要存在以下挑战:(1)长距离实体关系难以识别。由于梯度消失等问题,长距离实体之间的关系难以获取。(2)关系方向性难以获取。在抽取关系时应正确分配第一个实体和第二个实体。(3)覆盖关系难以抽取。由于覆盖关系之间存在推理,如何利用推理信息是解决覆盖关系抽取问题的关键。针对以上挑战,本文基于图卷积神经网络提出了两种联合实体关系抽取模型,主要的工作如下:(1)针对长距离实体关系识别以及关系方向性获取的问题,提出一种基于剪枝依存树图卷积的联合实体关系抽取模型。该模型由两部分构成:序列层和图卷积神经网络层。序列层用于抽取实体;图卷积神经网络层用于抽取关系。为使模型具有获取关系方向性的能力,模型依次拼接两个实体和句子语义特征。为解决长距离实体问题,模型采用以路径为中心的剪枝策略修剪句法依存树。最后,通过在NYT数据集上进行实验验证模型有效性。(2)针对覆盖关系抽取问题,提出一种基于关系感知图卷积的联合实体关系抽取模型。该模型将联合抽取分为两个子任务:检测实体跨度以及同时识别实体关系类型。为了获取覆盖关系三元组之间的推理信息,本文提出了关系感知注意机制获得两个实体跨度之间的关系特征,并且根据实体跨度以及关系特征构建一幅全连接图。此外,为了在编码节点特征时能同时利用相邻节点特征和边信息,本文对原始图卷积神经网络进行了改进。最后,在NYT和Web NLG数据集进行的实验结果说明所提出模型的效果。
其他文献
临床常用的承重骨替换修复体钛是一种生物惰性材料,需改性赋予其生物活性。植入体内后,钛的生物性能已固定,其与宿主的相互作用无法根据体内微环境的动态变化主动调整。因此,通过体外刺激调控钛的生物活性以适配修复过程具有重要的实际意义。研究表明,材料表面特性,如形貌和电势等,是影响细胞行为的重要因素之一。然而,表面形貌和动态电势结合对细胞行为的影响尚不清楚,因此,本文对此问题进行了研究,具体内容如下:(1)
随着现代社会不断发展,人工智能的应用场景和遇到的现实问题越来越复杂,获取具有充分标注的数据集的代价越来越昂贵,这使得传统有监督机器学习算法的应用难度不断提高。域适应作为迁移学习的重要分支,是近年来广受关注的一种机器学习方法,当目标域数据集标签不足时,可以借助相似但不同的有标签源域数据训练分类器,并对目标域分类。此外,在实际生活中,还存在另一种更常见且更具挑战性的情况,即源域和目标域特征空间不一致造
伺服系统近年来应用广泛,在工业机器人、数控机床等应用场景中越来越多。随着工业信息领域技术日新月异,伺服电机的发展方向也越来越明确:即实现轻量化、自动化、高精化。尽管伺服电机优点突出,但是其研究中也存在诸多不完善的地方,值得进一步研究。基于上述相关背景,本文对伺服领域的永磁同步电机展开了研究。首先,针对伺服领域对电机有安装尺寸要求,电机需具备高转矩密度的性能,因此提出研究设计一款内置式永磁电机。根据
在传统软件应用开发模式中,开发团队与运维团队的工作相对独立,这常常导致在软件功能不断增多,软件架构逐渐变得复杂的生产实践场景中,软件的开发与交付速度难以满足版本快速迭代的需求。DevOps(Development&Operations)是一种通过将开发与运维紧密结合,从而提高软件应用的开发效率、加快其交付速度并降低测试和运维工作的成本,同时保障应用的服务质量的开发理念。容器技术是DevOps实践最
伴随着5G、云计算时代的到来,通信运营商既面临着挑战同时也存在机遇。在电信大数据、个人征信的背景下,运营商不再是简单的提供通信、上网服务,构建全面的、有效的用户画像刻不容缓。一个合理的信用评价模型能通过分析用户数据,挖掘潜在客户,关注低信用客户,避免呆账坏账,提高企业利润。论文研究重点是针对电信数据集类不平衡问题进行信用评价模型构建。主要研究内容和成果如下:首先对原始电信数据集进行了预处理和特征选
近年来,全球人口不断增长,以化石能源为原料生产的化学品的需求大量增加,地球上有限的资源面临巨大的挑战。其中环己醇及其衍生物这种化学品在工业上有很大用途,可以应用到农药、化妆品、香料等领域。然而环己醇及其衍生物的生产来源于酚类的加氢和烃的氧化,这些原料都来自于不可再生的化石能源。寻找可再生能源来生产这种化学品很有必要。木质素是自然界中唯一具有芳香结构的可再生资源,目前可以将木质素催化解聚成酚类和烃类
改革开放以来,珠三角依靠自下而上的农村工业化带动了城市的快速发展,形成了“村村点火、户户冒烟”的工业格局,为早期经济腾飞奠定了基础。然而,粗放发展的村级工业园不仅消耗着大量土地资源,还使顺德出现了土地低效利用、环境污染严重、和空间破碎化等一系列问题。随着土地资源日益紧缩,土地开发模式面临着从“量”到“质”的转变,城市发展的重心也从“增量外延发展”步入了“存量内涵提升”。在此背景下,通过推动村级工业
氧化锌(ZnO)具有理论储锂容量高、绿色环保、简单易得、成本低廉等优点,被认为是极具发展潜力的新型锂离子电池负极材料。然而,ZnO负极存在着充放电过程体积膨胀导致的容量衰减严重以及导电性差导致的大倍率性能差的问题。将ZnO纳米化并与碳基材料复合可以有效抑制ZnO的体积膨胀并优化材料的导电性。木质素作为自然界第二大的生物质资源,其碳含量高达40-60%,表面含氧官能团丰富,且具有独特的三维网络结构。
随着智能终端的轻薄化发展及5G技术普及应用,超薄微热管因体积小、导热率高、稳定性好的突出优势,成为以智能手机为主的电子设备核心散热元件。但超薄微热管同样因尺寸优势给制造带来困难,尤其是缩径工序中铜管因刚度及强度较差而难以顺利成形。为解决上述问题,本文在传统模压缩径法的基础上,通过对成形模具施加额外的旋转运动提出针对微小型铜管加工的旋转模压缩径方法,能在保证成形质量的前提下实现更小的缩径系数与更高的
锑被用于印染行业中的催化剂及阻燃剂,会随着废水排放至环境中,重金属锑对环境和人体具有很高的潜在毒性,因此,由印染废水产生的锑污染问题备受关注。目前关于印染废水除锑的研究报道有混凝沉淀法、吸附法等,但这些方法存在处理成本高、产生二次污染等问题。因此,仍需要开发更加经济高效的印染废水除锑技术。为此,本研究利用污水处理厂生化过程中产生的剩余活性污泥,采用吸附等方法,对印染废水进行了除锑实验。一方面,探究