论文部分内容阅读
随着网络信息技术的发展,网络远程辅助教学逐渐成为人们进行学习的一种有效方式。由于网络教学本身的一些制约,问答系统成为它的有益补充。随着计算机和人工智能技术的飞速进步,涌现出了各种实现形式的网络问答系统。目前国内的问答系统仍存在明显欠缺,主要体现在系统不够智能和知识库标准化不够两个方面。智能性不足表现为不能采用自然语言而只能使用关键术语的逻辑组合进行提问。知识库标准化不足的后果是知识的共享重用困难。因为本体对文档的内容进行了标记,可以通过概念间的相互关系来表达语义,因而使得利用本体对资源进行基于内容的检索成为可能。随着对本体理论和技术的进一步研究,一些学者开始探索应用本体理论和技术到搜索引擎和智能问答等领域中。作为本体研究的一个具体应用领域,基于本体的智能问答系统开始受到学者关注。本文主要工作如下:一、总结了智能问答系统在国内外的研究现状,指出了国内的智能问答系统存在的问题,综述了有关技术(如本体和中文分词)的研究现状,重点讲述了本体的描述语言、构建方法,总结了中文分词算法及其面临的问题。二、运用史丹佛大学开发的Protégé4本体开发软件,本文设计实现了一个初步的知识本体——“计算机网络”课程知识本体。该本体使用类似史丹佛大学医学院发展的七步法并吸取了国外一些成功的本体工程的构建经验。三、本文给出了一个基于知识本体和中文分词技术的智能问答系统模型,该模型克服了传统的智能问答系统中所遇到的一些问题。在该模型中,系统首先会对用户使用自然语言语句的提问进行自动分词处理;接下来扩展关键术语,并基于领域知识本体和扩展的关键术语集合,构建SPARQL查询;最后,到知识本体库中去寻找出与问题相匹配的答案。如果在知识本体库中无法找到匹配的答案,则去课程文档库进行查找,将相似的文档按相似度从大到小的顺序显示给用户。在本模型中,我们采用多级分词方法,即:先提取专业术语(使用专业词库)和信号词(使用信号词库),然后提取普通词语,本文采用了词典优化的逆向最大匹配分词算法。