面向旅游领域的实体预测方法研究

来源 :昆明理工大学 | 被引量 : 0次 | 上传用户:xufei777
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互相网的发展,网络数据呈现爆炸式的增长,因此知识图谱的不完整性成为制约其被广泛应用于智能搜索、智能问答、个性化推荐等领域的主要问题。而实体预测作为知识图谱补全的重要组成部分成为近年来知识图谱的研究热点。本文在现有研究的基础上,结合旅游领域实体较多、关系比较明显的特点,以实体链接为入手点,进行了面向旅游领域的实体预测方法的研究工作。主要完成了以下研究工作:(1)基于关系指数和表示学习的旅游领域集成实体链接针对现有实体链接方法不能很好结合文本信息和知识库信息的问题,结合旅游领域特点,提出一种基于关系指数和表示学习的旅游领域集成实体链接方法。首先构建了特定领域知识库;其次运用表示学习从文本信息中得到的向量表示计算实体指称项的上下文、主题关键词、扩展词三个特征的相似度;然后利用知识库中的关系信息计算候选实体的关系指数;最后将这三种相似度及关系指数相融合,用于实体链接。实验结果表明,相较于现有方法,该方法能够有效的提高F1值,并且该方法不需要标注语料,更加简单高效,适应于缺少标注语料的特定领域。(2)可学习图自注意力网络的端到端旅游领域知识表示学习针对现有方法没有考虑知识图谱的全局图结构信息以及知识信息不均等的特点,提出一种可学习图自注意力网络的端到端旅游领域知识表示学习方法。首先利用图自注意力网络得到知识图谱中实体节点的相关性排序;其次根据得到的相关性排序构建可卷积知识子图,获得实体的编码表示;再对关系信息进行建模,获得关系信息的编码表示,并将实体和关系的编码表示结合,获得最终的三元组嵌入表示;然后利用Conv KB模型,通过可信度得分函数对得到的三元组嵌入表示进行解码,最终获得信息更全面的知识表示。该方法利用多头图自注意力机制,赋予图谱节点不同的重要程度,并且实现了知识子图的卷积操作,增加了网络模型的可学习性。同时在解码器部分通过改进构造负样本的方式,降低了不良负样本对模型的影响。实验结果表明,提出的方法能够获得信息更丰富的知识表示,有效的提高了Hits@10、MRR值。(3)增强内部逻辑的旅游领域实体预测面向知识图谱的实体预测,即根据已有知识信息预测出潜在的三元组,在语义搜索和智能问答等应用领域发挥着重要作用。现有的实体预测方法,主要是基于表示学习或融合关系路径的方法,利用实体和关系的向量计算进行实体预测。但是这些方法在学习能力和泛化能力以及在多逻辑的实体预测任务上都表现不佳。针对以上问题,提出一种增强内部逻辑的旅游领域实体预测。该方法首先利用p Trans E模型得到实体和关系的向量表示;然后通过Mem N2N网络模型,根据得到的知识表示信息学习预测出实体信息,从而实现补全知识图谱中的三元组。该方法利用了知识表示的强计算能力和Mem N2N的强学习能力、泛化能力以及多跳注意力机制。实验结果表明,提出的方法在多步推理方面表现优异,能够有效的提高Hits@10、MRR值。
其他文献
钒氧化物由于其独特的金属-绝缘相变(MIT)特性备受人们关注,目前在光电探测、场效应晶体管、热/光开关等领域得到广泛的应用。然而由于钒氧化物在生长过程中存在多达十三种相互竞争的钒氧化物相以及大多钒氧化物热力学不稳定等问题,使得高质量的、物相单一的钒氧化物,尤其是混合价态的钒氧化物(如V6O13)的合成面临巨大的挑战,成为制约钒氧化物特性及应用研究的一大问题。解决上述问题的关键在于掌握钒氧化物生长过
随着的我国现代化进程的推进,工业化和城市化也必然随之推进,城市周边的许多农业用地将被转化为非农业用地,农民也将失去其赖以生存的土地资源。由于政府在城镇化进程中对自
室内定位技术是指基于室内场景下的位置定位相关技术。在室内场景下,由于无法使用卫星定位等技术,因而借助部分其他传感器信号完成人员以及物体在该场景下的位置检测。随着基于位置的服务日渐火热,室内定位技术逐渐成为定位领域的研究热点。目前,室内定位领域通常使用无线通信技术、射频识别技术以及惯性传感器定位等技术实现定位目标的精准监控,同时,越来越多的研究者开始研究综合使用多种定位方式的融合定位算法。除此之外,
随着医疗行业信息化水平的不断提高,医学影像数据量日益膨胀,行业内普遍现状是对于这些具有多种模态的医学图像数据一直缺乏有效的管理和检索方式,多种模态的数据检索成为了亟需解决的问题。另外,如何快速检索到对医生有用的信息,解决检索过程中存在的效率问题也是需要考虑的,比如病灶的定位,而这在大多数时候还是依靠医生机械地在检索到的序列中进行寻找,计算机辅助分析的程度还不够。针对上述问题,我们构建了跨模态的医学
党的十九届四中全会强调坚持和完善生态文明制度体系,促进人与自然和谐共生,并阐明了生态文明制度体系在中国特色社会主义制度和国家治理体系的重要地位。绿色消费的法律制度和政策导向是生态文明制度体系的主要组成部分,因此,理解消费者绿色消费行为对完善和发展相关生态文明制度体系非常重要。本文以通勤者绿色交通消费行为为研究对象。为了明确在不同时间和伴随出行约束下消费者的绿色交通消费行为决策机制,本文以消费者行为
静态代码检测工具主动执行代码检查以及分析,有助于提前发现并预防错误,能够在很大程度上提高软件可靠性并降低软件开发和测试成本。但是由此带来的问题是静态分析往往产生大量伪缺陷报告,人工审查误报是必要的。人工审查会耗费大量的时间和精力,因此优化静态检测工具产生的报告很有必要。本文在大量分析缺陷检测结果的基础上,提出了一种基于机器学习的代码缺陷自动确认方法。本文首先分析真实缺陷和误报之间的差异,将缺陷代码
人类社会进入20世纪以来,随着计算机、网络和通信技术的联合,标志了人类社会进入了崭新的信息时代。得益于信息时代的发展,网络技术也飞速发展,以太网(Ethernet)是目前最普遍使用的局域网技术,近年来,以太网技术也发展迅速。作为以太网网络上的重要部分,以太网PHY(物理层)芯片始终支持着以太网的高速发展。作为以太网PHY芯片中的关键模块,时钟产生电路很大程度决定了以太网的性能。本文在旨在研究IEE
由于人们对多媒体的需求不断增长,人们对图像的视觉质量也提出了越来越高的要求。迄今为止,图像处理技术作为视觉监控应用的预处理已经受到了研究者的广泛关注。作为传播信息的媒体之一,图像包含丰富的信息,因此在人类生活的许多方面都发挥着非常重要的作用。随着成像系统的发展,人们获得的图像质量远远超过了过去。但是,图像的视觉质量仍需要改善以满足人们的期望。由于不同图像是在各种不同的条件下拍摄的,例如拍摄时的天气
现代战争中,电子战占据了极其重要的位置,且已经成为继陆、海、空、天之外的第五维作战空间。随着空间电磁环境的日益复杂,电子侦察测向面临严重的欠定信源估计问题。相较于阵元的均匀线阵,稀疏阵列具有自由度更高和孔径更大的特点,这使得在降低系统复杂度的同时大大提高了系统的测向性能。然而大多数稀疏阵列都具有一定的局限性,其差分阵列往往存在一定的孔,严重限制了阵列的测向性能。为进一步提高稀疏阵列的测向性能,本文
当今世界越来越重视能力与专业的培养,教师是一个专业性极强的的岗位,需要其具备专业实践能力。美国的教师教育机构认证制度有了新的突破,从认证重点上看,美国专业认证标准将更加重视师范专业的临床实践及临床伙伴关系,更加关注实践导向的认证,并且重视大学与伙伴关系的教育实习合作。合作视角下的教育实习在形式、参与方等方面较为多样化,职前教师实习的内容、流程和评价由合作的双方共同协商决定。教育实习合作要确保理论与