基于知识图谱子图融合的多关系问答

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:eden_1005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能问答技术在生活中的逐渐普及,人们对问答系统的要求也在不断提高。然而传统问答系统一般对手写规则和模板依赖程度较高,存在泛化性能不强,实用性较差等问题。要提升问答系统的性能,可以通过赋予问答系统知识储备和知识推理能力的方式,利用知识图谱对问答系统进行外部知识补充是一种可行的方法。知识图谱是一种高效的知识表示形式,在搜索、推荐等领域有着广泛的应用,可以为问答系统带来可观的性能提升。针对知识图谱问答研究方向,本文主要完成了两方面工作,分别是基于预训练模型的中文知识图谱问题生成方法和基于知识图谱子图融合的多关系问答方法。现有中文知识图谱问答语料库大多存在规模较小,质量较差等问题。因此,本文提出一种基于预训练模型的中文知识图谱问题生成方法。该方法的架构思想来源于条件变分自编码器,基于该想法本文设计了一种预编码器-源编码器-解码器核心架构。该架构利用预训练模型BERT进行预编码,并采用Transformer模型构建源编码器和解码器。此外,该方法还结合了答案编码技术并进行了改进。该工作的实验部分使用NLPCC2017 KBQA数据集进行实验,实验结果表明该模型在BLEU、ROUGE以及人工评价指标上较基线模型有明显提升,并且能够生成更具多样性的问题。本文利用该方法构建了一个中文图谱问答数据集,作为多关系问答方法的实验数据集之一。多关系问答是在一个问题中存在两个或两个以上三元组的问答任务,复杂性较高。相关研究大多没有考虑问题所涉及的知识图谱子图信息,也不具备知识推理能力,导致性能较差。因此,本文提出一种基于知识图谱子图融合的多关系问答方法,该方法利用知识图谱点边关系和子图结构来提升知识表示能力,并结合可解释的推理网络赋予模型知识推理能力。实验在真实数据集PathQuestion和WorldCup2014上进行,实验结果显示该方法较其他基线模型有一定提升。此外,选取部分基线模型与本实验模型在上述问题生成模型所生成的中文图谱问答数据集上进行了实验比较,实验结果表明,基于知识图谱子图融合的多关系问答方法在中文数据集上也有更高的准确率。
其他文献
校园足球可以分为校园足球教学、校园足球队训练、校园足球文化建设和校园足球联赛四个部分,其核心内容是校园足球教学。心理技能训练是运动训练的重要组成部分,被广泛应用于
随着我国社会经济的发展,人们的法律意识也在逐渐增强,不动产物权的管理与登记由不同部门组成,需要在登记簿上进行相应的记载公示,这样不动产物权才能够得到保证。房产测绘是
介绍用一片GAL16V8实现的模≤2^n可编程计数器。它是基于“最大长度移位寄存器式计数器”的原理设计而成的,电路简单可靠,同时介绍一种由它组成的实时电路-由GAL实现时、分、秒计时的数字钟电
烟草设备上的不锈钢罩壳比较复杂。为了减少焊接时的变形。根据罩壳的外形结构,选择合理的焊接位置,控制合理的焊接参数,在三维焊接工作台上强制焊接,保证了罩壳的焊接质量,提高了
大中型水库移民后期扶持工作实施13 年,1 个20 年的扶持期间已过半,有必要对该项点工作在我区实施成效进行分析、总结经验得失,展望未来愿景,让移民群众同步奔小康,同步实现
本文基于2017年3月至9月在北京市、成都市、广州市、上海市、西安市、郑州市抓获的6000余名网络贩毒人员的电子支付数据分析了他们的行为特点和人身特点,根据网络贩毒人员表
介绍一种完整的工业用数字化传感器接口芯片ADIB60,各种低电平信号采集系统(如重量、压力、温度)采用它之后,可大大提高系统的精度及智能化程序。给出了ADIB60的电构成,具体介绍了其应用。
介绍MC145026、MC145027脉冲编码及解码集成电路的工作原理与技术特性,并给出了这两个集成电路在工作电视监控系统主控制电路中的设计方案与工作过程。
结合烟台天马中心超高层建筑高强混凝土泵送施工的具体实例,分析了超高层建筑高强混凝土的泵送,不仅要从原材料的选择、高强混凝土的配合比设计考虑,还要综合考虑混凝土泵送
<正> 在按装好的增音段上,为了要补偿对称电缆高頻回路间的剩余复数耦合,和保証具有必需的串音防衛度,可以裝設由电阳R和电容C所組成的反耦合網絡来进行集中平衡。反耦合網辂