基于知识图谱与子图匹配的学术大数据查询系统

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:monzad
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能和深度学习的兴起,推动统计学习发展的同时,知识图谱也受到了国内外广大学者的关注和研究。目前,知识图谱主要有着智能问答,推理推荐,图嵌入等方向的研究,而这些研究主要被应用在医疗、金融、企业管理以及一些大型的搜索引擎,例如谷歌Google、百度和微软Bing。同时,随着时代的进步,世界各国对科学与技术的投入与日俱增,每年有大量的年轻学者加入到科研的行列,世界范围内被发表的论文也呈指数增长。学者的科研与成长离不开参阅同领域其他学者发表的优秀论文,但是在如此繁多的论文中找到自己最需要的论文无疑是一个难点,也是众多学者的需求点。由作者,论文标题,论文领域,作者所处机构,论文发表会议以及时间等实体所构成的学术领域大数据正日益变得庞大,其信息的高效承载和有效检索也显得日益重要。本文致力于在学术领域构建知识图谱,用于承载其巨大的数据量和复杂的异构关系,然后基于此构建一个应用于学术领域的智能问答系统。首先,在Acemap的1.5亿学者信息数据库之上,构建以作者,论文标题,论文领域,作者所处机构,论文发表会议以及时间为实体名称的内容全面的巨大知识图谱。对于智能问答系统,其通常可以分为两个阶段,即问题语言理解和查询-答案评估。问题理解是将自然语言转换为可以在知识图谱搜索过程中使用的形式,而查询-答案评估旨在结果导向的评估系统的形式和答案。其中,问题语言理解阶段为整个问答系统的关键,它将决定问答系统的整个性能。而现阶段,问题理解的解决方案可以分为三类:语义分析,信息提取和矢量建模。这三种解决方案在一定程度上都有着难以弥补的缺陷,而本文在这一阶段要做的便是集成这三种方案各自的优点,摒弃其缺点,以达到对于给定的自然语言问句,将其转换为可以直接在知识图谱数据库上查询的SPARQL查询语言,利用子图匹配的到查询结果。最后,本文还设计给出了基于知识图谱的智能问答系统实用且用户友好的前端。
其他文献
360度视频的高精度和全景特性既给用户带来了沉浸式体验,也使其在现有网络中传输面临巨大的挑战。这种挑战性表现在传输整个360度视频会占用大量的带宽资源,容易引起网络拥堵和造成传输延迟。事实上,当用户佩戴头戴式显示设备观看360度视频时,同一时刻仅能看到一部分视频区域。因此,结合Tiling技术和自适应流传输技术,将360度视频在时间和空间上切片,以Tile粒度传输视频可以节约大量带宽资源。另一方面
视频中的行为识别一直以来都是计算机视觉社区中最热门并且悬而未决的问题之一。行为识别不仅能够直接运用在智能监控,无人驾驶,人机交互等多个领域,并且是许多其他视频研究任务的基础。随着深度学习技术的发展,行为识别这一领域涌现了许多基于深度神经网络的新算法。主流的方法大体上分为3D卷积,双流,循环神经网络三个家族。依靠这些方法,视频的时空特征能够被有效地挖掘和运用。这些模型能够在UCF101,HMDB51
深层页岩气储层岩石组构复杂、非均质性强,基于矿物含量三端元的岩相分类无法精细反映其非均质性变化。利用X射线衍射、物性、薄片、地球化学以及测井等资料,对川南泸州地区五峰组—龙马溪组深层页岩地层开展了以“氧化还原+TOC含量+矿物组分”三重信息为基础的微相细分,分析了不同测井曲线对微相细分类型的敏感性,并采用基于K-means的贝叶斯判别法建立了微相细分类型的测井精细识别方法。结果表明:(1)研究区页
转移肿瘤是指癌症从身体的一个部位扩散到了另一个部位,大约三分之二的癌症患者都会患有骨转移肿瘤,而脊柱是骨转移肿瘤最常见的发病部位,脊柱转移肿瘤可能会引起病人疼痛、脊椎不稳定和神经损伤。因此,脊柱转移肿瘤的早期检测对于疾病的精准分期、改善患者的预后以及最佳治疗方案的选择至关重要。在脊柱转移肿瘤的临床诊疗中,脊椎的检测分割以及骨质质量的诊断分类是两个非常重要的问题。本文针对这两个问题,基于深度学习的方
随着科技的发展,学者的数量也迅速增长,由于学者之间交流频繁,而且学者个人信息在许多领域都有应用,因此如何准确快速地获取学者信息变得非常重要。Acemap作为一个学术大数据平台,目前数据库中还缺少相关学者信息的数据。本文从Acemap的实际情况出发,对使用计算机方法自动从互联网中获取学者信息进行了研究。本文将该过程分成三大部分,分别是网络数据采集、学者主页判别和学者主页信息抽取,对每一部分分别进行了
期刊
语义分割是一种细粒度的场景理解任务,在自动驾驶、计算影像等众多应用中起着至关重要的作用。随着深度学习的发展,基于深度模型的语义分割算法也取得了重大的进步。但是由于语义分割需要像素级别的精确标注,相较于分类模型极大地提升了标注的难度和成本,也限制了语义分割任务在新场景的应用和扩展。为此,本文探究在弱监督情况下,即如何在降低数据标注的数量或者质量的情况下,保证分割模型的效果。针对语义分割任务中图像标注
智能驾驶中车辆检测技术这一核心环节,在自主导航、碰撞检测等应用中有着重要的地位。通过输入的传感器数据,车辆检测算法提取环境中的特征,实时检测环境中的车辆目标及其空间位置以及车辆目标当前的姿态,从而合理地对车辆前进路线进行规划。虽然在现有研究下,已经有部分较为成熟的车辆检测算法,但这些算法仅能在光照等环境条件理想的情况下实现车辆检测,并且由于激光雷达本身的限制,远距离目标的点云数据十分稀疏,极大地影
“儿童的发现”是教育史上的“哥白尼革命”,儿童和成人一样,是权利的持有者,是知识的创造者,是积极的行动者。师幼关系作为幼儿园重要的人际关系之一,对儿童的发展有着深远的影响。因此,了解儿童是怎么看待师幼关系的、儿童对当前的师幼关系是否满意、儿童期望的师幼关系是什么样,对于建立良好的师幼关系、促进儿童发展有着重要的意义。本研究选取了30名大班儿童作为研究对象,利用专门研究儿童视角的马赛克方法,将观察、
高速公路建设项目的竞争越来越激烈,高速公路建设施工运营机制和市场管理也发生了巨大的变革,受外部环境和各项因素的制约,建设施工安全问题日益突出,不同程度地增加了建设施工的风险。基于此,文章剖析了高速公路工程施工安全风险管理的意义,制订了完善的应对策略,为同类工程施工奠定了坚实的基础。