论文部分内容阅读
面向领域的数据库问答系统是允许用户用自然语言访问数据库的一种方式,它是多学科交叉的产物,涉及自然语言处理,数据库技术,人工智能,人机界面等多方面研究。四十多年来,面向领域的数据库问答系统方面的研究取得了很大进步,但其系统没有能够广泛地推广应用,还有很多问题需要进一步的解决。基于建立通用模型的思想,本文设计了一个通用的领域数据库自然语言接口模型,深入地研究了实现该模型的原理、技术和方案,同时建立了一个具体的实现系统,并希望该系统很容易地移植到其他应用领域。本文研究的内容是设计和实现一个实用的数据库自然语言接口系统,并深入研究其中两大关键技术的理论和策略,主要有以下几个方面的研究成果:1.在“知识表示与提取”方面,本文采用“分而治之”的思想将知识库的组建和系统的程序设计分离开来,并将知识库中的两大主要组成部分-通用知识库和领域知识库分别独立设计。使得系统具有较好的可移植性和可适应性。2.在“中文自然语言问句理解”方面,提出了一种改进的基于分块查找的最大匹配算法,该算法改变了原有的顺序匹配方式,提高了分词和标注的效率;采用了基于数据库语义的标注方法,改变了传统的词法分析、句法分析和语义分析等多个繁琐的步骤。由于充分利用了数据库的模式信息,后续语言处理的工作量就大大减少了;采用了多级链表的中间语言表示方法,这种表示方法清晰明了,便于从自然语言到SQL转换和从SQL到自然语言的转述;提出了各类查询目标和查询条件的分类及识别方法,并引入了复合概念和推演概念,增强了系统识别数据库隐含知识的能力,使得系统具有更好的健壮性和智能性。由于本文采用的是一种具有约束性的自然语言式的中文查询语言,即它在保证符合中文自然语言形式描述的前提下,限制使用有限的构造形式,从而使数据库自然语言查询接口中的处理变得可行而有效。另外,该系统如果和语音识别等智能系统有机结合起来,会有很好的发展前景。