【摘 要】
:
问答系统是近年来自然语言处理、信息检索等领域研究的热点。相对于传统搜索引擎只能得到繁琐且模糊的信息,问答系统可以返回给用户更加精准的答案。知识图谱可以将碎片化的知识通过三元组的方式组织起来,建立数据间的联系,形成网络,更有利于信息的搜索、挖掘和分析,因此基于知识图谱的问答系统(Knowledge Based Question Answering,KBQA)成为越来越多人的研究对象。但是目前对于KB
论文部分内容阅读
问答系统是近年来自然语言处理、信息检索等领域研究的热点。相对于传统搜索引擎只能得到繁琐且模糊的信息,问答系统可以返回给用户更加精准的答案。知识图谱可以将碎片化的知识通过三元组的方式组织起来,建立数据间的联系,形成网络,更有利于信息的搜索、挖掘和分析,因此基于知识图谱的问答系统(Knowledge Based Question Answering,KBQA)成为越来越多人的研究对象。但是目前对于KBQA的研究也存在一些难点:一方面,当前的问答方法难以有效实现涉及多实体的复杂问句的问答;另一方面,传统的问答方法在属性映射上的准确率还不高。对于问答系统的研究可以分为开放域问答系统和限定域问答系统。限定域问答系统由于其领域范围小,特征明显,算法精准度更高,因而更易投入使用,对提高专业领域的智能化服务水平具有重要的意义。本文选取了高考咨询领域进行问答系统研究,因为我国高考人数众多,在报考志愿时对于信息查询有着巨大的需求。传统的信息查询方式是上网搜索、书籍查询、人工咨询等,耗时耗力,如果能够建立一个囊括所有学校相关信息的问答系统,快速准确的返回需要的答案,那么就可以弥补目前在报考学校时信息难以查找的不足。本文面向高考咨询领域开展对于基于知识图谱的限定域问答系统关键技术的研究,主要内容如下:第一,设计了在KBQA领域的问句分类体系的构建方法以及对应的分类方法,首先根据爬取的问句设计了高校信息知识图谱的数据模式,然后将问句分类体系的划分与知识图谱的数据模式相结合,根据数据模式中的实体和属性将问句类别划分为大小类,并分两步进行问句分类。第二,提出了BERT-Bi LSTM模型来提升相似度的计算精度,既有利用BERT(Bidirectional Encoder Representations from Transformers)结合上下文动态生成词向量的优势,又利用了双向长短时记忆网络(Bi-directional Long Short Term Memory network,Bi LSTM)进一步捕捉句子信息,用以提高相似度计算的准确率,将此模型用于问句分类和问答过程中。第三,研究了针对复杂问句的问答方法,提出了一个改进的基于语义解析的问答模型,通过添加约束生成查询图,然后将查询图自动转换成Neo4j查询语句,再到数据库中检索得到答案。第四,通过自顶向下的方式构建了高校信息知识图谱,根据问句分类阶段设计好的数据模式从多个网站爬取高校信息、整理格式后导入到Neo4j数据库,然后在此知识图谱的基础上实现了基于语义解析的高考咨询问答系统。
其他文献
目前文本隐写方法可以分为修改载体法和无载体法。由于文字本身的编码冗余度很小,对文本很轻微的改变都有可能被人或机器检测出来,因此修改载体法隐藏容量较小,安全性较差。无载体隐写可以分为生成法和检索法。其中,生成法的载密文本是根据传递的秘密消息借助于自然语言处理技术生成的。虽然自然语言生成技术已有很大进步,但在生成较长文本时仍存在可读性差的问题,很容易被人识别出来。而检索式无载体方法通过建立映射关系,找
随着电气化的飞速发展,伺服系统已经从早期的液压伺服系统过渡到当前的电机伺服系统。伺服系统作为运动控制系统执行机构的核心部分,其性能是整个控制系统性能的重要衡量指标。以工业机器人为例,工业机器人在搬运、焊接、激光切割、喷涂等应用场景中具有高精度位置控制、负载时变、启停频繁且响应快速等特点,这就需要机器人关节处永磁同步电机同时具有高精度、快速响应和更强的抗干扰能力。近些年随着智慧工业的发展,为了简化系
永磁同步电机(Permanent magnet synchronous motor,PMSM)因具备制造成本低、结构简单等优越性而被广泛应用于各个领域中,所以对于PMSM驱动系统的控制算法有了更高的要求。为了保证PMSM具备良好的动态与稳态性能,分别从动态控制和稳态控制的角度出发设计出不同的控制器,并将这些控制器利用协调控制策略协同起来,达到了PMSM驱动系统的高性能要求。论文主要内容为:(1)研
多容水箱系统具有多变量、强耦合、高非线性和复杂度高的特性,是非线性控制理论应用的重要领域之一。这些特性都会影响控制系统的稳定性,而且多容水箱系统受未知扰动和参数的不确定性影响较大,使得控制任务更加复杂,多变量的精确控制也非常困难。因此,解决多容水箱系统的扰动抑制和多变量控制中的问题对于工业生产具有重要指导意义。(1)采用了一种基于扰动观测器的积分反步控制策略处理双容水箱系统存在的扰动影响。首先,为
聚类算法是数据挖掘的主要任务之一,其主要用于发现数据库中未知的对象类别。子空间聚类作为目前主流的聚类分析算法,被广泛运用于计算机视觉、人工智能、网络分析和模式识别等领域。目前关于子空间聚类算法的研究成果繁多,其中基于谱聚类的子空间聚类算法具有显著的聚类效果。在聚类分析的应用领域中,高维数据普遍存在,尤其是面向二维数据的(即一个样本为一个矩阵)算法研究十分匮乏。对于二维数据来说,现有的子空间聚类方法
随着计算机技术的发展,计算机视觉系统已广泛应用于众多的科学、工程以及军事等领域,然而,在雾、霾等恶劣的天气条件下,获取到的图像往往视觉质量不佳,这将对许多户外计算机视觉应用产生不利影响。因此,图像去雾变得至关重要,是目前计算机视觉领域广泛研究的一个重要内容。针对暗原色先验理论在去雾过程中存在的部分图像边缘模糊、纹理细节丢失、且图像噪声扩大的不足,本文提出了两种不同的图像去雾算法:(1)考虑到变分模
由于全球气候变暖导致干旱发生的频率增加,干旱目前已成为全世界关注的重点问题之一,对干旱进行监测,可以减少因干旱导致的灾害。因此选择一个合适的干旱指标精准监测山东省的干旱情况,进而提高对旱情的预报与监测水平,对山东省的发展有重要的意义。本研究以山东省为研究区,主要研究山东地区2001-2017年气象干旱以及农业干旱,以期为监测山东省长时间序列的干旱旱情提供参考。本文主要研究的内容有以下三点:(1)基
随着柔性制造系统和智能仓储系统的快速发展,自动导引车(Automated Guided Vehicle,AGV)的应用需求日益增长。AGV是一种装备有电磁学或光学等传感器的自动导航装置,能够装载货物沿规定的导航路径行驶。为了提高AGV作业效率,降低运输成本,本文针对仓储环境提出基于强化学习的AGV路径规划方法。针对单AGV路径规划,提出了一种强化学习-蚁群算法。针对蚁群算法在某些情况中的缺陷,将强
高光谱图像包含丰富的图像与光谱信息,是典型的高维数据。高光谱图像分类是特征提取与地物解译的重要内容。研究人员可以通过分类的结果了解农业、环境和区域的变化并采取相应的措施。Potts模型是半监督变分分类模型,为数据分类提供了通用的理论框架,可拓展解决高维数据分类问题。同时,该框架能够融合非局部方法、约束优化方法实现高精度高性能数据分类,进而提高对高光谱图像分类的准确度和计算效率。本文基于Potts理
人脸是人体非常重要的生物学特征,人脸检测、人脸分割等人脸处理技术目前已广泛应用于安全、通信、医疗等领域,具有深入研究的实际意义。人脸分割的目的是找到人脸的轮廓,从而将人脸与图像背景分离。人脸分割作为多种应用的基础算法,对精度有很高的要求。由于姿态、脸型、发型遮挡、拍摄角度等原因,图像中的人脸的轮廓有很大的几何差异,这些因素影响分割精度。目前依然存在人脸检测不准确造成的人脸分割不精确问题,以及难以精