中文旅游领域知识图谱构建及应用研究

来源 :陕西师范大学 | 被引量 : 0次 | 上传用户:houyangpeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人工智能(AI)是大数据时代带来的一项重大变革,它正以迅雷之势开始对我们生活的各个方面产生影响。而知识图谱(Knowledge Graph)作为AI领域最重要的技术基础,其研究热度必然日益升温。作为一种通过逻辑符号实现对现实世界中概念及其相互关系进行描述的高度结构化的语义知识库,知识图谱就像是一个能够打开AI魔盒的神奇按钮,将越来越多的智能应用如新一代智能问答系统、搜索引擎等展现在世人面前,同时进一步引领不同的学科领域(包括旅游、金融、教育、电信、医疗等)开启新的发展纪元。本文立足中文旅游领域,针对当前形势下运营商和游客的困扰:如何有效解决知识图谱构建过程中出现的人力和时间成本、知识图谱的补全、实体对齐以及知识服务呈现方式等问题,我们对中文旅游知识图谱构建及应用进行了一系列的完善,期望让游客能够在海量的旅游数据里快速、准确地捕捉到自己所需求的信息。具体工作如下:(1)针对知识图谱构建过程中存在着耗时、费力以及知识图谱补全等问题,我们通过对中文旅游领域知识图谱的构建方法进行优化,即以旅游实体库的方式,从现有高质量的中文百科知识库中筛选出旅游知识来构建新的中文旅游领域知识图谱,以起到节约人力和时间成本的目的;并借助引入外部知识库XLore的方式,最终能够实现对中文旅游领域知识图谱的InfoBox补全。接着,在本文构建完成中文旅游领域知识图谱基础上,针对现有知识表示学习模型如TransE等仅片面获取三元组信息而损失较多其他相关知识信息的不足,我们这里尝试了将TransE与实体描述文本信息进行融合,即在BERT模型产生实体描述文本向量的基础上,将其通过单隐层的神经网络与TransE模型结合。随后我们采用该新型TransE模型以嵌入的方式将本文构建知识图谱内部的所有实体及其关系投射到同一个低维的连续向量空间,得到实体和关系对应的低维度的向量表示,最后由链接预测、三元组分类实验证明了该方法是行之有效的。(2)针对知识图谱构建过程中知识整合阶段存在的实体对齐问题,本文通过对自然语言处理领域词向量表示技术的学习,提出了一种新的实体对齐实现方法。其核心点在于神经网络词向量表示技术、BERT模型的微调以及将实体对齐视为二分类问题来建模。最终通过与CBoW模型、Skip-gram模型、DSG模型以及ELMo模型的对比看,该方法确实在实体对齐任务表现上优势明显。(3)为了更好地为游客提供高质量知识服务,实现知识的链接与共享,我们在中文旅游领域知识图谱构建完成的基础上进一步搭建了知识服务原型系统。实现了包括旅游实体语义搜索、旅游知识图谱可视化、旅游实体知识卡片、InfoBox展示、知识库内的实体链接、旅游景点推荐、旅游知识API发布以及旅游知识库更新等诸多功能。
其他文献
生姜(Zingiber officinale Roscoe)为姜科姜属多年生草本植物。生姜在幼嫩时期采收的姜称为仔姜。仔姜生长周期短,上市时间较集中,代谢旺盛,含水量高,不耐贮藏,贮藏期容易出现失水、褐变、霉变、腐烂等现象。本研究以四川省乐山市白口仔姜为实验材料,研究不同贮藏温度、不同保鲜剂及保鲜剂复合处理对仔姜贮藏期间品质及活性成分的变化影响,旨在筛选出仔姜的最佳贮藏温度、适宜的保鲜剂,结果如下
CuZrCr合金具有高强度、高导电导热性等优异性能,现已广泛应用于航空航天、电子电力和新能源等领域。随着工业技术的发展,传统CuZrCr合金产品性能已无法满足新兴产业和国家重大工程的需求。选区激光熔化(Selective Laser Melting,SLM)技术作为增材制造技术的一种,因其设计自由度高、材料利用率高、复杂构型能力强等诸多优点备受关注,为制造高端复杂结构CuZrCr合金产品提供了可能
先进的电介质能源存储技术的发展是一个全球关注的重大问题,其中材料的创新将在下一代电子电气应用中起着至关重要的作用。聚合物介电材料由于良好的加工灵活性、低损耗、高绝缘强度和更快的充-放电效率,成为现代电介质材料发展的一个重要方向。但较低的介电常数(<4),导致了较低的能量密度,从而增大了电容器的体积。因此,设计新型高性能的聚合物是十分必要的。本文设计和合成了含联吡啶及金属配合物侧基的聚合物,利用金属
本实验以尤力克柠檬为材料,优化了采后乙烯脱绿处理条件,研究了乙烯脱绿对尤力克柠檬品质、贮藏特性以及果皮色素代谢的影响。以下为主要的实验结果:(1)筛选尤力克柠檬采后乙烯脱绿的最优条件。采用单因素、正交试验法,通过熵权法得到最终的综合评分,对采后乙烯脱绿尤力克柠檬的温度、乙烯浓度、2,4-D浓度以及脱绿时间进行优化。试验结果表明:最优脱绿温度为28℃,乙烯浓度为5mg/L,2,4-D浓度为30 mg
全碳环和杂环是多种天然产物和药物分子的重要组成部分,过渡金属催化二烯类化合物的环化官能团化反应是构建环状化合物最有效的手段之一。本学位论文旨在探究以二烯类化合物为原料构建环状化合物分子的方法,具体包括以下两部分:1)镍催化1,6-二烯的环化氢芳/烯基化反应以甲醇作为氢源、Ni(COD)2作为催化剂前体,开发了第一例镍催化1,6-二烯与有机硼酸的环化氢芳基化和环化氢烯基化反应,具有中等到优秀的产率和
第一章绪论毛细管电泳(CE)已发展成为一种模式多样、用途广泛、较成熟的分离分析技术,可以与多种检测器联用。其中,由于电容耦合非接触电导检测(C4D)技术与生俱来的一些特点,CE与通用型的C4D联用在环境、药物、食品和生物等分析领域具有广阔的应用前景。但是,由于C4D灵敏度不高,仍无法满足复杂样品中低含量目标物的直接灵敏检测。绿色样品预处理技术为复杂样品的纯化与选择性富集提供了新途径。本章在对CE-
自然水体中药品和个人护理品类污染物(PPCPs)的不断累积逐渐表现出生物毒性,传统水处理工艺对此类污染物的去除存在去除率低和易受干扰的缺点,分子印迹聚合物能够实现靶向去除,在复杂水环境中选择吸附性强的优点能够弥补此短板。本研究针对传统分子印迹聚合过程无法控制,易导致吸附位点被覆盖而降低吸附性能的问题,以PPCPs中的癫痫治疗药物卡马西平(CBZ)为目标污染物,采用可逆加成-断裂链转移聚合(RAFT
镉(cadmium,Cd)是一种有毒重金属,通常以二价离子形式存在,是最具毒性的环境和工业污染物之一。Cd具有强烈的生物毒性,长期暴露在Cd环境中会导致肾脏、肝脏、肺、胰腺、睾丸以及骨骼等组织器官中积累大量的Cd,并造成严重的器官功能异常。此外,Cd还可以穿透血脑屏障在大脑神经元中积累,造成神经元产生过量活性氧,引发氧化应激甚至导致神经元凋亡,目前发现Cd也是阿尔兹海默症、帕金森病等神经退行性疾病
二氟亚甲基作为羰基和其它极性官能团的生物电子等排体,将其引入目标分子可以改变药物分子的药理性质及提高生物活性分子的活性;另一方面,具有最高Hansch-疏水性系数(π=1.44)的三氟甲硫基具有独特的理化性质(如增强细胞膜的穿透性、改善药物的代谢稳定性等),常被用于药物以及生物活性分子中。生物体内的手性识别作用促使不同构型的药物分子往往具有不同的药理活性。因此发展手性含二氟亚甲基或三氟甲硫基分子的
钛硅分子筛/双氧水(TS/H2O2)体系催化的酮类氨肟化反应是肟类化学品绿色生产的发展方向,该反应过程为:氨和双氧水吸附于Ti活性位点上形成羟胺(NH2OH)中间体,羟胺与底物酮反应形成目标产物酮肟。因此,羟胺的无效分解直接影响该体系的氮原子有效利用率,如何提升反应过程中氮原子利用率、减少温室气体N2O的产生是目前面临的关键问题之一。本论文以氮(N)原子经济性和反应过程绿色化为指导,系统研究了羟胺