【摘 要】
:
近些年来,伴随着互联网技术的迅猛发展,互联网上的信息呈指数级的增长,这些丰富多彩的信息增强了用户在互联网世界获取到大部分知识的可能性,但同时也导致用户从中获取有效信息的效率越来越低,所以人们希望快速获取有效信息的呼声越来越高。于是问答系统应运而生,它有别于返回一系列文档或网页的传统搜索引擎,可以理解用户的搜索意图,并在极短时间内给出一个简明扼要的答案,问答系统也因此成为人工智能研究热潮之一。本文在
论文部分内容阅读
近些年来,伴随着互联网技术的迅猛发展,互联网上的信息呈指数级的增长,这些丰富多彩的信息增强了用户在互联网世界获取到大部分知识的可能性,但同时也导致用户从中获取有效信息的效率越来越低,所以人们希望快速获取有效信息的呼声越来越高。于是问答系统应运而生,它有别于返回一系列文档或网页的传统搜索引擎,可以理解用户的搜索意图,并在极短时间内给出一个简明扼要的答案,问答系统也因此成为人工智能研究热潮之一。本文在分析知识图谱问答系统相关技术的基础上,深入研究实体和关系抽取、候选实体排序以及知识表示学习技术,并在传统经典模型和算法上进行改进,给出本文的创新模型和算法,并将之用于真实数据中,构建出本文的基于中文知识图谱的问答系统,具体的工作如下:(1)在信息抽取任务中,传统的串行式方法将其分为实体抽取和关系抽取两个子任务,这种方法存在误差累计和信息利用率低的缺点,所以本文提出BA-IE模型,它采用Bi-GRU提升模型的训练速度,同时引入注意力机制增强模型对问句的语义理解能力,最终实现实体与关系的联合抽取,并在公开数据集上进行对比验证,证明了本文提出的模型在信息抽取任务中具有良好的表现。(2)在实际应用中,实体链接返回的候选实体列表是无序和无语义关联的,会极大地增加知识推理的时间成本,本文引入基于流行度、语义相似度和字符相似度的多评分机制,提出MS-Rank算法对候选实体列表进行排序,有效减少知识推理过程中的冗余计算。(3)为解决传统TransE模型中部分实体的知识表示具有高度相似性的问题,本文在TransE模型的基础上引入实体的事实描述,提出改进的FD-TransE模型,从而扩大实体知识表示之间的距离,并在公开数据集上进行验证,证明了本文模型可以有效解决上述问题。(4)本文结合第三章和第四章中的模型和算法,设计并实现了一个基于中文知识图谱CN-DBpedia的问答系统,最后在真实的数据流环境中进行系统测试分析。
其他文献
介绍了剪切式单齿辊破碎机(以下称单齿辊破碎机)的特点和工作原理,详细论述了单齿辊破碎机结构参数的确定和计算方式,有关计算公式中各系数的选择和确定,论证了国内外单齿辊
在信息化的21世纪,中小企业的生存竞争环境发生着巨大变化,企业经营的一个重要标准是信息技术运用水平的高低,企业要实现现代化,必须提高效益,掌握技术,才能让企业在竞争中长
针对FNY—200C自动缝焊机对中装置对中精度低、运行稳定性差且不易实现对中自动化的缺点,进行了一系列改进。改进后的对中机构采用液压驱动,并利用反馈装置来实现对中过程的
试验选用126 d的绍兴鸭商品代母鸭432羽,按L9-3~*正交试验法设9组,分别喂以不同代谢能(11.67、11.30 MJ/kg和11.92 MJ/kg)和粗蛋白质(16.5%、18.5%和20.5%)水平的日粮,试验至
伴随着全球经济的进步和信息技术的发展,离岸服务外包作为一种经济全球化新潮流和当代产品内分工的重要表现,研究如何发展中国离岸服务外包对我国经济发展有着重要的意义。
卡拉先格尔斑岩铜矿(带)位于阿尔泰东南缘晚古生代岛弧区,含矿斑岩主要为一套中-晚海西期的中酸性斑岩,围岩为中泥盆统北塔山组。通过对含矿斑岩的岩石学和地球化学研究表明
遵义市网箱养殖兴起于20世纪80年代,一路蓬勃发展,成为一个体量巨大的产业,年产量一度达到4万余t,有效地解决了广大群众吃鱼难、吃鱼贵的问题,为我市水产品市场供给做出了不
目前,教育的大环境已经发生了变化,在新教改的推动下,素质教育已经成为高校进行教学的重点。对于学生来说,高中是最为关键的学习时期,不仅仅是价值观树立和重塑的重要时期,也
概述了精细化管理的内涵,分析了企业在推进精细化管理方面存在的体系化推进不足和信息化支撑不够的突出问题,结合信息化与精细化的关系论证,提出了一种依托信息化开展精细化
风洞模拟试验是风工程研究的一种重要手段,在对大气边界层风洞进行数值模拟的时候,湍流模型的选取是影响模拟计算结果的至关重要的因素之一,本文针对大气边界层的风洞模型为