基于深度学习算法的中文文本与SPARQL的转换方法研究

来源 :电子科技大学 | 被引量 : 2次 | 上传用户:ligang_nc2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语义搜索技术是当今互联网的新趋势,也是互联网技术发展的热门之一。语义搜索离不开语义网的发展,正是基于语义网的这些标准与技术,才能够让计算机对互联网上的信息进行收集整理和理解推理,进而为用户提供语义搜索的功能。对于这类问题,很多传统的基于领域知识库的问答系统被提出,用于满足用户访问特定知识的需要。这些问答系统通常基于从数据观察得出的手工和统计模型。最近,Seq2Seq架构在序列任务转换工作中的表现让人看到了深度学习的能力。因此,本研究以该深度学习架构为基础,提出一种新的模型用于取代传统问答系统中的手工和统计模型,称为基于Seq2Seq的SPARQL翻译模型,该模型能够实现直接将用户提出的中文自然语言问句转换为SPARQL标记序列,然后生成SPARQL语句这一整个流程,换句话说,就是使用端到端的方法将整个自然语言表达式转换为最终查询。本研究通过知识抽取技术,以DBpedia的数据为蓝本,创建用于本实验的中文领域知识库,其中包含36,714个三元组和678个实体。再通过手动构造的49个查询模板,生成由29400条中文问句和对应的SPARQL语句组成的实验数据。具体实验为使用Google NMT开源项目搭建用于本文学习的深度学习架构,在TensorFlow上测试以上所得到的实验数据。以Accuracy评分作为模型的评测标准,多次不同模型参数所进行的实验结果显示,两层双向LSTM与Luong注意力机制的组合在测试数据上的收敛速度最快,也得到了74.8的最高分数。经过对查询模板和实验数据分布的调整,最后的分数提高到了87.6。以上实验表明,基于Seq2Seq的SPARQL翻译模型是一个令人期待的实现基于领域知识库问答系统的新解决方案。
其他文献
根据流体包裹体均一温度、盐度、拉曼光谱和储集层自生伊利石K Ar同位素测年的研究结果 ,冀中坳陷文安斜坡上古生界煤成烃油气藏的形成有两期 ,第一期发生在中生代末 ,但成藏
通过对多项科学的身体机能评定指标的测试和分析,客观地评定羽毛球运动员竞技状态、运动性疲劳的程度、机体恢复的情况,对科学地调整竞技状态、合理安排运动训练负荷、预防过
<正>现代教育理念作为指导教育改革的思想,为了适应社会对人才的要求,愈加重视"以人为本",把学生看作是学习的主体,认为学生是动态成长的,而不是被动机械的,教师在教学中应尊
本文重点从心理学的视角,以具体的设计案例为对象,对建筑光环境与心理学原理间的关系进行研究,深入了解建筑光环境设计中的心理学因素。
传统智能材料用于结构振动控制时,需要硬线连接传输控制信号,易受到外界电磁干扰,影响信号传输的准确性及控制结果的可靠性。PLZT铁电陶瓷材料在一定光能照射下会产生光电热力多
低聚笼型倍半硅氧烷(POSS)是一种有机/无机纳米杂化材料,能够以物理共混或化学交联的方式引入到各类聚合物中,POSS能够与聚合物实现真正意义上的分子级复合,能够显著提升聚合物的机械力学强度、热稳定性、阻燃性、抗氧化、抗老化等性能。本论文合成环氧POSS,利用环氧POSS对环氧树脂改性进行研究。本文采用水解缩合法先合成八乙烯基POSS,研究硅烷偶联剂单体、溶剂种类、催化剂(盐酸)浓度、反应时间和反
应用GPC、1 3CNMR、DSC等方法 ,对用DQ球形催化剂在环管连续法工艺聚丙烯生产装置上制备的几种典型牌号聚丙烯均聚物、无规共聚物、多相共聚物的结构进行了研究 ,并测定了树
采用量子化学密度泛函方法分析了煤相关含氧模型化合物苯甲酸和苯甲醛的热解机理。微观结构分析、热力学和动力学分析结果表明:煤热解过程中CO2和CO的逸出分别与脱羧和脱羰反
钢筋混凝土异形柱结构体系在8度抗震设防区适应性的研究工作表明:节点承载力成为异形柱结构在8度区最大适用高度的控制因素,基于此我国异形柱规程规定,8度(0.2g)地区钢筋混凝土异形柱框架结构最大适用高度为12m。8度区12m的高度限值严重制约了异形柱框架结构在高烈度地区的推广和应用,为提升异形柱框架结构在高烈度地区的适应性,已有相关理论分析和试验验证表明,节点区加配钢骨是一种有效的方法。为了促进型钢
目的 探讨阴茎癌临床与病理特点对淋巴结转移的影响,以筛选发生淋巴结转移的高危病人。 资料和方法 应用Logistic逐步回归法对46例阴茎癌病人的临床表现和病理特点,包括肿瘤