基于本体的智能信息检索系统的研究

来源 :中国农业大学 | 被引量 : 0次 | 上传用户:ghanfeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
采用HTML表达的网络已经成为世界上最大的信息资源库。如何获取网络中对用户有用的信息,成为信息检索研究的重点。搜索引擎的使用大大简化了用户查找信息的过程。但是,伴随着网络信息数据量急剧增加,信息的类型也越来越多元化,而传统的搜索引擎单纯依靠“关键词”进行信息筛选的方式,已经不能满足用户的需要。而本体作为领域内不同主体之间进行信息交流的语义基础,有助于解决知识描述的语义问题。 在这种情况下,本文提出了一个基于本体的智能信息检索系统,并给出了它的结构体系和工作流程。系统的工作分成信息获取及整理、信息查询两个工作过程。在获取并整理信息的过程中,通过本体提供的知识信息,将获取的网页进行分类和排序,形成一种有序的知识结构体系。在查询过程中,依靠本体支持的推理体系和用户的注册信息,实现对用户检索过程的导航,并按照用户的背景知识对排序进行修正,使得检索结果尽可能符合用户的检索目的。 在系统结构的基础上,设计了一个系统原型LCOS1,并实现了部分关键模块。在信息采集模块中,针对URL性能瓶颈问题,提出了一个有限步长的搜索算法并进行了实验分析。在本体支持模块,研究了本体的设计和重用,并构建了一个描述中国农业大学部门的本体,同时讨论了本体设计的方法;在语义注释器部分,讨论了针对HTML的语义注释器的实现途径;在文档排序及归类部分,讨论了如何对网页进行归类整理,如何排序网页和本体文档;在推理机引擎部分,分析了当前推理机引擎的现状,研究了用于检验可满足性问题的Tableau算法,并讨论和实现了一个适合于本系统的推理机引擎。在WebService模块中,讨论并设计了系统的用户界面及预处理过程。 实践表明,该系统具有良好的可应用性和可扩展性,且提高了信息检索的准确率。
其他文献
基本养老保险制度的健康安全运行是我国社会保障事业平稳持续发展的重要前提,也是促进国家安定、社会和睦和人民幸福的关键所在。因此,运用科学有效的评估技术对国家现行养老体制的实际执行状况进行客观、切合实际的评判,已经显得极为重要和紧迫,并且对于进一步优化和完善我们国家的社会保障机制有着极其重要的现实意义。本文首先通过文献研究法,重点探究了养老保险领域评价指标体系的研究现状,并综合专家经验选取出了 14项
微博作为近些年新兴的社交网站,对整个互联网产生了巨大影响,微博服务极大的拉近了人与人之间的距离,让人们拥有了新的合作与交流方式。对于微博网络中的用户,每一个用户都是
人工神经网络走过了半个多世纪的曲折历程,吸引了许多科学家在这个领域研究,成为现代脑神经科学,数理科学以及信息科学等综合研究领域的共同的科学前沿之一。二进前向网络是
本文全面分析了流媒体系统中的OoS问题的影响和制约因素,基于流媒体代理缓存的优点,在参考已有的流媒体代理缓存理论和传统的流媒体技术中基于流媒体服务器端.客户端(即C/S模式)
随着CAD教学成为工程图形教学内容的重要组成部分,以及远程教育的需求,计算机考试已经越来越成为工程图形考试的一种重要考试形式,与此相伴的,计算机的自动阅卷就是亟待解决的问
消息中间件在企业信息系统间数据交换和共享过程中起关键性作用,不同系统所实现的功能不同,消息的表现形式也就存在较多的差异,如可以把文本、声音、图象、MP3或其它形式的数
随着互联网的飞速发展,电子商务应运而生,它不仅提高了人们的生活效率、节省了大量费用,而且提高了社会的生产能力。协商是电子商务进行在线交易的重要方法,也是智能Agent设
抄袭是指使用其他作者的内容、思想或观念等作为自己的原创作品,而不做任何引用或参考标志的现象。当今是一个全球化的信息世界,互联网已经成为主要信息访问媒介。无论是用户
利用计算机视觉技术,对作物进行长势监测是温室作物田间管理智能化自动化的先进技术手段之一,在作物管理决策中愈来愈受到重视。 本文在总结国内外相关研究进展与成果的基础
电信企业是信息化建设的关键所在,如何加快电信企业的建设,提高信息化程度,是我国信息化产业所面临的现实问题。NGOSS提出一系列的文档、信息模型和代码,分析研究企业核心业