【摘 要】
:
实体链接和关系链接是知识库问答场景下的两个重要任务,目的是将自然语言问句中提及的实体和关系映射到知识库中对应的目标实体和目标关系上。实体及关系链接效果极大地影响问答的准确性,是制约知识库问答方法提升的瓶颈之一。在缺少上下文信息的问句场景中下进行实体及关系消歧是当前面临的巨大挑战。现有的研究方法大多将实体链接和关系链接作为两个独立的任务来解决,导致错误传播以及信息利用不充分等问题。本文的研究目标是将
论文部分内容阅读
实体链接和关系链接是知识库问答场景下的两个重要任务,目的是将自然语言问句中提及的实体和关系映射到知识库中对应的目标实体和目标关系上。实体及关系链接效果极大地影响问答的准确性,是制约知识库问答方法提升的瓶颈之一。在缺少上下文信息的问句场景中下进行实体及关系消歧是当前面临的巨大挑战。现有的研究方法大多将实体链接和关系链接作为两个独立的任务来解决,导致错误传播以及信息利用不充分等问题。本文的研究目标是将实体链接和关系链接视作联合任务来处理,提出了一个面向知识库问答的实体及关系联合链接框架。联合链接分为三个阶段:实体及关系指称联合识别,候选生成,以及候选联合消歧。重点是在候选联合消歧阶段,本文提出了利用独立特征和联合特征进行特征组合的方法实现实体及关系联合消歧。以下是本文的研究内容:(1)将实体及关系指称联合识别视作序列标注问题,使用一个基于大规模语料预训练的神经网络模型来解决。通过与另外两个基线模型对比,分别验证了字符级别特征、条件随机场解码以及预训练模型对于实体及关系指称识别结果的影响。(2)抽取知识库中包含实体标签属性和实体重定向信息以及实体别名信息的三元组,构建指称-实体映射词典。收集所有关系词的近义词和派生词等构建指称-关系映射词典。通过对词典建立索引,从而实现将指称作为关键词进行检索即可得到其在知识库中的实体及关系候选集合。(3)在候选联合消歧阶段,从独立特征和联合特征两个角度分别捕捉实体候选和关系候选的特征信息,为每个实体候选和关系候选计算特征得分,最后选取得分最高的作为链接结果。实体的独立特征从实体流行度和指称实体间的字面相似度两个角度衡量;关系的独立特征从指称关系间的字面相似度和语义相似度两个角度衡量;联合特征通过实体候选和关系候选构建查询图,从图编码和序列编码两个角度计算查询图与问句间的语义相似度;最后结合独立特征和联合特征实现实体及关系联合消歧。本文实现了一个面向知识库问答的实体及关系联合链接原型系统,在三个主流问答数据集上对本文方法进行了有效性验证。本文工作的意义在于,基于一种联合的思想为实体链接及关系链接任务提供了一个有效的解决方案,对进行后续的知识库问答任务具有重要价值。
其他文献
人和机器人共融的核心是自然人机交互。基于运动想象脑电、稳态视觉诱发电位及事件相关电位的智能假肢、外骨骼机器人和康复机器人等BCI系统在残障人士的生活辅助和运动功能康复等方面取得了一定的研究成果,然而,这些技术仍存在脑机交互不自然的问题,如利用脚部的运动想象来控制神经假肢的功能。实现自然且直观的脑机接口控制可促进用户和BCI系统的共同演化过程,使得用户积极参与并改善康复效果。基于脑电的自然动作解码为
随着移动互联和数字图像处理技术的不断发展,获得数字图像的成本不断降低,同时先进的图像处理工具使得对图像进行操作变得易如反掌。图像操纵可以轻易地实现诸如对象复制、拼接以及删除的操作,被恶意利用产生的篡改图像则可能给社会带来负面影响,误导大众。由于在视觉上可能无法分辨被操纵的区域,如何防范这些篡改图像则是一项艰巨的任务。现阶段已经有了很多针对图像篡改的检测算法,但这些方法大多需要手工特征提取,往往使用
智能通信作为未来通信技术发展的主流研究方向之一,在5G(5th Generation Mobile Communication Systems)加速普及的当下,具有重要的研究价值。智能通信引入人工智能(Artificial Intelligence,AI)技术解决通信难题,例如在物理层的信道估计、信号检测与信道译码等研究问题中,AI辅助的算法设计能够达到甚至超越传统算法性能,展示出巨大研究价值。智
随着物联网技术的蓬勃发展,大量智能终端的应用对未来的无线通信系统提出了支持海量设备同时可靠接入的需求。免调度无线接入系统中,用户终端可以自发向基站发送数据,不需要向基站发起调度请求,从而减少信令开销,降低传输延时和智能设备功耗。这些优势使免调度无线接入技术成为了大规模机器类型通信(massive Machine Type Communications,m MTC)场景下的关键技术之一。然而,由于基
语音增强作为语音信号处理的一个重要分支,在语音通信、听觉辅助、自动语音识别(Automatic Speech Recognition,ASR)系统前端等领域都有重要的应用。早期提出的一些传统单通道语音增强方法,虽然计算简单,但是降噪效果不佳,尤其是对非平稳噪声。近些年兴起的深度学习算法大大提升了单通道语音增强的性能水平。然而,基于深度学习的语音增强模型往往难以有效地泛化到现实场景中。此外,在移动或
激光雷达采集获取的点云数据凭借其准确的深度信息和稳定的存储结构能够有效反映几何模型的形状结构以及雷达周围环境的障碍物信息,因此点云数据处理技术近年来在三维模型分析以及移动机器人导航控制领域得到迅速发展。由于传统分析点云数据的方法往往会选择点云重建或者内部采样的方法,而重建与采样的过程往往繁琐且计算资源消耗大,这就可能导致各类应用工作效率低下。受启发于点云可见性判断的方法,本文引入了可见单元的概念,
近年来,随着MEMS技术的发展,硅微机械陀螺仪的研究得到了快速的发展,并迅速在军事和民用领域有了广泛的应用。本文主要以课题组自研的双质量硅微机械陀螺仪为研究对象,对陀螺仪的噪声性能和标度因数非线性度指标进行了较为深入的分析和研究,本文的主要研究内容如下:(1)驱动回路噪声模型分析。首先,详细介绍了驱动回路测控系统的工作原理,具体分析了各个环节的作用;然后,指出了驱动回路中存在的噪声类型,并建立了驱
随着我国BDS的快速发展、Galileo的建设推进以及GPS、GLONASS的改进完善,全球导航卫星系统(GNSS)已被应用到各个行业。GNSS在实际应用中容易受到各种观测误差的影响,通常采用站间/星间差分或绝对误差改正方法以消除或削弱星端、接收机端、电离层和对流层等误差。但多路径误差由于与卫星位置、接收机周围环境以及天线的反射特性有关,具有很大的随机性和复杂性,常规的差分方法并不能有效的抑制,且