应用于社区问答的知识感知神经网络

来源 :深圳大学 | 被引量 : 0次 | 上传用户:hanbing81868164
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
尽管在NLP领域中已经有很多相关研究,但在现实世界中对问题答案对进行排序仍然是一个挑战:(I)首先,开放域知识图(KGs:Knowledge Graphs)的背景知识在问题回答中起着至关重要的作用。现有的基于上下文的模型可能会给否定答案比肯定的答案分配更高的分数,因为否定答案与单词级别的给定问题更相似。然而,借助背景知识,我们可以正确识别基于KG中包含的相对事实的肯定答案。(ii)此外,现实应用中普遍存在的冗余和噪声问题(例如CQA)仍有待解决。然而,先前的研究利用KG的外部知识专门进行了k认知单个单词的学习,而不是捕获不同句子之间的相互关系,这对于对问题答案对进行排名很重要(iii)双向循环连接使RNN适合于任何长度的顺序预测任务,但是由于处理序列信息将不可避免地导致整个网络的信息状态在稍后的时间收集导致信息不平衡,导致网络在长句子上的表现不佳。为了缓解这些限制,我们提出了一种知识意识的神经网络结构,以交互方式学习基于知识的句子表示和基于上下文的句子表示,以对QA对进行相关度排序。BERT[52]的网络架构使用多Transformer结构,而Transformer基于自注意力机制:任何单元都可以直接交互,并且没有长度限制问题,可以更好地捕获长距离特征,因此,相距较远的元素可以通过较短的路径(O(1)vs O(n))进行交互首先,我们使用知识嵌入方法对KG的知识嵌入进行预训练,然后设计混合注意掩码,以学习嵌入在KG中的离散候选实体的基于知识的句子表示。最后,我们提出了一种知识意识的注意力机制来学习问题和答案的知识意识的句子表示,从而自适应地确定基于上下文和背景知识的重要问题和答案信息。本文的主要贡献可以概括如下:(1)我们提出了一种基于BERT模型的知识感知的新型深度学习网络模型结构,并具化为三个模型:KIBERT(Knowledge-aware Independent Representation Neural Network with BERT),KCBERT(Knowledge-aware Cross-DNN Neural Network with BERT)与KFBERT(Knowledge-aware Fusion Attention Neural Network with BERT)。它利用KG的外部知识来捕获问题的背景信息。以及对QA对进行排名的答案。(2)我们引入了预训练的BERT模型。BERT训练数据使用英语开源语料库BooksCropus和英语Wikipedia数据,共33亿个单词。这进一步提高了单词向量模型的泛化能力。通过添加其他层,可以调整预训练的BERT表示以创建适用于更多任务的当前最佳模型。(3)我们开发了一种混合注意力矩阵-知识交互学习体系结构和一种基于线性注意力的独立注意力知识感知结构,该体系结构利用来自编码层的文本特征和融合外部KG的交互信息来监督句子和外部知识的表示学习。(4)知识感知注意机制是一种使QA对能够识别文本之外的一些背景信息和隐藏关系的方法。对于问答句,我们将两种不同的句子级别的表示向量:基于词向量嵌入获得的向量和混合KG的外部知识获得的向量表示进行交互获得最后用于分类的最终层输入。以及通过问答融合的方法进行的对基于词向量嵌入获得的向量和混合KG的外部知识获得的向量进行多角度答案融合以得到最终的双重答案特征来输入最后的分类层。
其他文献
卷积神经网络(Convolutional Neural Network,CNN)已经被广泛地应用在许多人工智能平台中。但是,由于卷积神经网络的推理过程涉及大量的数据迁移以及复杂的数据计算,它们仍然很少被部署在移动或边缘平台上。新兴的神经架构(Neuromorphic Architecture)旨在结合存内计算技术(Processing In Memory,PIM)来减少数据迁移,它采用三维堆叠的形
特征提取是数据分析中的核心步骤之一.如何从海量的数据中提取其有用信息已成为目前应用数学与模式识别领域的一个热点问题.常用的特征提取方法包括主成分分析(PCA)、线性判别分析(LDA)、局部保持投影算(LPP)和非负矩阵分解(NMF).其中,非负矩阵分解(NMF)是主要针对非负数据的一种特征提取方法,其在人脸识别、聚类及高光谱分解等方面有着广泛的应用.然而,传统NMF还存在一些问题,比如没有充分利用
在现实工程问题中,多目标优化问题(MOPs)是一类非常常见的优化问题。多目标优化问题通常包含两个或两个以上相互冲突的目标。近年来,一系列针对不同类型多目标优化问题的多目标智能优化算法相继提出。然而,对于一些具有复杂的Pareto最优解集或最优端面的复杂多目标优化问题,它们的Pareto最优端面不同部分具有不同的收敛难度或者逼近的困难。因此,这类复杂多目标优化问题能有效地检验多目标智能算法的种群多样
目前,移动机器人的定位系统及算法在室内环境中已经取得了较好的定位效果,但是这些系统及算法在室外运行时会由于室外非结构化的环境、噪声和光照等各种因素的影响而无法很好地运行,因此室外移动机器人的定位仍然存在着许多问题亟待解决。本文主要研究使用视觉的传感数据在室外环境下移动机器人的定位问题,主要的研究内容如下:首先,针对移动机器人的定位问题,本文主要利用的是贝叶斯滤波的框架,已知贝叶斯滤波主要是通过运动
互联网技术发展迅速,网络文本信息激增。信息传播迅速而广泛,对社会有着重大的影响,因此高效地分析和处理文本信息变得尤为重要。文本分类是处理文本信息的关键技术之一,它可以帮助企业等各种机构有效地组织信息。因此,文本分类技术的研究在社会应用中具有重要意义。在文本分类技术中被广泛使用的循环神经网络(Recurrent Neural Network,RNN),由于其有时间方向的传播和层与层之间的传播的两个维
近年来在国家优惠政策的支持和计算机视觉技术的发展,安防监控及计算机视觉相关产业快速发展,政府、公共场所、火车站、企业、城市、区民小区都跟随国家的政策和计算机视觉产业的需求,加入到安防产业的研究和落地,由于智慧城市和大数据城市的打造,安防相关产业一直保持高增长态势。随着人工智能和计算机视觉技术的发展,人脸、行人、车牌等成为了重要的监控对象。在大数据的不断发展,人脸检索算法需要消耗大量的检索时间,同时
机动目标跟踪无论在军用还是民用领域皆有广大的应用需求与实际意义,也一直是热点研究方向。在众多机动目标跟踪算法中,交互式多模型(Interacting Multiple Model,IMM)是应用最广泛的一种算法。然而,传统IMM算法在跟踪机动目标时,往往会出现模型库庞大导致计算量剧增、模型库难完全匹配目标运动状态的问题。针对上述问题,本论文基于模糊信息处理原理,引入目标模糊语义信息,重点研究基于特
生物特征识别技术是利用人固有的生理特征和行为特征进行个人身份识别的技术,已成为应用数学和信息技术领域非常活跃的研究方向.人脸识别是生物特征识别的一种形式,其需要在计算机的辅助下进行,并具有非接触性和非强制性等优点.人脸识别的关键在于提取人脸图像中的特征信息,非负矩阵分解(NMF)是一种有效的图像数据特征提取方法,其能够提取人脸图像中有意义的非负特征信息.但是传统的非负矩阵分解算法没有充分的利用样本
随着信息时代的到来,作为信息的主要载体,图像的数据量也在不断地增长。因此,在大规模图像数据中利用图像检索技术快速检索出相似的图像信息成为了研究的热点方向。传统图像检索技术分为基于文本和基于图片内容的图像检索技术两种。但是它们存在标注人工主观性以及高数据维度问题,会导致存储及计算资源过大。为了更好地减少存储空间以及提高检索速度,在图片特征处理上采用哈希编码成为现在的主流。基于哈希的图像处理方法包含特
随着云计算、雾计算等网络技术的发展与应用,越来越多的用户开始体会到将个人重要数据使用公有服务器进行存储和计算的优势。就以云计算技术为例,云计算技术可以保证用户数据的可用性和完整性,并且按照各个用户的需求进行个性化服务、海量资源共享以及按照使用服务进行精准消费。因此,对于这种便利且高效的网络技术服务架构,越来越多的用户、企事业单位等会把自身重要数据委托给云服务提供商进行管理。然而,对于日益增长的数据