基于知识图谱的问句语义理解技术研究与实现

来源 :国防科技大学 | 被引量 : 0次 | 上传用户：netchina123

【摘要】

：

随着互联网的飞速发展,如何在海量的数据中快速地检索到人们所想要的信息,是现在乃至未来Web发展的方向。准确理解用户的自然语言问句进而在Web数据或在知识图谱中进行检索,

【作者】

：

韩晗

【出处】

：

国防科技大学

【发表日期】

：

2004年期

【关键词】

：

知识图谱关键短语抽取问答系统语义解析

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着互联网的飞速发展,如何在海量的数据中快速地检索到人们所想要的信息,是现在乃至未来Web发展的方向。准确理解用户的自然语言问句进而在Web数据或在知识图谱中进行检索,是下一代智能搜索引擎的核心组成部分之一。本文针对搜索引擎或者问答系统领域中的问句语义理解问题,设计了一种基于知识图谱的问句语义理解系统,该系统把用户的问句转化为与问句语义等价的结构化图数据库查询语句,然后通过该查询语句检索图数据存储的知识图谱,获得智能解答。本文的主要工作如下:为了从问句中抽取高质量的关键短语,本文提出了基于上下文特征和XGBoost的关键短语抽取方法。首先,借助含有丰富短语链接信息的百度百科构建短语词典,接着通过预先构建的短语词典提取每个问句中的候选短语,然后抓取短语丰富的上下文特征,如短语的统计特征:短语的短语稀有度特征等;短语的结构特征:短语的位置特征、短语的长度特征,短语的前置词特征、短语的后置词特征等;短语的句法特征:短语的前置词词性特征、短语的后置词词性特征等。来训练XGBoost分类器,利用训练好的分类器来抽取问句的关键短语。实验表明,本文提出的关键短语抽取方法提高了问句关键短语抽取的准确率。本文将问句的语义解析任务当做候选属性排序任务处理,基于深度学习方法设计并实现了基于传统的卷积神经网络的候选属性排序方法和基于Attentive Max-Pooling CNN的候选属性排序方法,其中基于Attentive Max-Pooling CNN的候选属性排序方法中改进的是卷积神经网络的池化层,在池化层中引入了简化的注意力机制,使得来自知识图谱中的属性信息影响到问句的分布式语义表示,并以此提高候选属性排序的准确率。

其他文献

2009年中国航海学会学术年会在北京召开袁林新应邀作学术论文写作专题报告

2009年中国航海学会学术年会于2009年12月22日在北京召开。会议由中国航海学会秘书长丁宝成主持，大连海事大学副校长刘正江和上海海事大学商船学院院长施朝健主持报告会，交通运

期刊

中国航海学会学术年会专题报告论文写作北京大连海事大学学术交流秘书长

人文社会科学学者谈和谐社会和谐文化

中共中央十六届六中全会公报才发表两天．本刊主编李汉秋就到沪召开座谈会。农工党上海市委会副主委姚俭建。朱冰玲，上海社会科学院吴绍中、尤俊意、徐澜波、张鹤年，上海交通大学

期刊

人文社会科学和谐文化和谐社会上海社会科学院上海交通大学学者六届六中全会华东师范大学

中国出口集装箱运输市场月评（2013年5月）

本期我国出口集装箱运输市场行情总体延续上月的下行走势，欧地、波红、澳新等多条远洋航线需求不振，拖累市场运价继续下滑。5月24日，上海航运交易所发布的中国出口集装箱运价综合指数为点，较上月同期下跌3.4%；上海出口集装箱运价综合指数为991.25点，较上月同期下跌5.5%。　　1 欧线运价跌势加剧　　5月欧洲航线正值由淡转旺的货量上升期，但由于2013年以来欧元区经济低迷，导致货量始终未见起色，加之

期刊

集装箱运输市场出口中国集装箱运价综合指数航运交易所市场行情远洋航线

止喘汤治疗婴幼儿哮喘疗效观察

期刊

婴幼儿哮喘止喘汤中医药疗法

针刺治疗不寐80例疗效观察

不寐又称失眠,或不得眠、不得卧、目不瞑,是指经常不能获得正常睡眠为特征的一种病症.其轻者入寐困难,寐而易醒,醒后不能再寐,亦有时寐时醒等;其重者则整夜不能入寐.

期刊

治疗疗效失眠针刺疗效耳穴贴压

中国枢纽港集装箱码头多式联运吞吐量快报（2012年5月）

<正>~~

期刊