基于本体的语义检索模型研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:jifengrgj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络的快速发展和网络上各种信息的激增,为了获得理想的有价值的信息,检索技术受到人们越来越广泛的关注。信息检索系统作为网络的一个重要组成部分,在满足用户信息需要的过程中,始终占据着非常重要的位置。传统的搜索技术,主要集中在关键字匹配方面,基本上没有涉及到语义层次。因用户表达不完整,表示差异和词汇孤立等问题,对于返回的海量的查询结果,给用户筛选的工作带来了很大的麻烦,其查全率和查准率往往不能满足用户的要求。为了克服以上存在的问题和不足,语义检索方法,受到了越来越多的重视,也成为研究的热点。语义网的提出和发展,为语义检索的发展提供了基础,语义检索同时也涉及到比较多的概念和实体,而本体具有良好的概念层次结构,因此,将其引入信息检索中的应用研究具,也具有重要的价值。基于以上原因,本文首先阐述了本体相关的知识和理论技术,简单介绍了语义网的概念与体系结构,并在分析传统信息检索模型的基础上,提出一种基于本体的语义检索模型。它与传统的基于关键词的搜索引擎不同,使用了基于概念的匹配方法,返回与查询概念相匹配的文档;它与当前的一些利用本体进行推理的检索方法相比,减少了对本体库的完备性的要求,其面向对象是整个互联网上的资源,也不是某个具体领域,扩展了使用范围,更具实用性。在本体构建过程中,采用骨架法原理,并结合分词统计的方法,通过对计算机领域文档的分析,获取领域概念和实例及其之间的相关性,最终获得计算机领域本体。在概念权重计算方法中,增加了与概念相关的词汇的权重计算,并使用词汇相似度表示相关词汇的权值系数。在相似度计算方面,使用了文档概念匹配系数比值作为相似度,抛弃了以往的向量空间余弦夹角算法。通过使用构建的计算机领域本体,由实验进行比较,在不同相似度标准下,基于本体的语义检索模型相比传统的关键词搜索引擎来说,无论是在查全率还是查准率上,都有了一定的提高,说明基于本体的语义检索模型具有一定的优势。基于本体的语义检索,因语义网、本体论及自然语言处理等技术的发展而发展。在本文在研究过程中,对于本体库的构建、本体与语义检索的结合、权值系数的确定以及对搜索结果的性能评价等,都有很大的研究空间,这也是下一步工作的主要内容。
其他文献
随着软硬件技术的不断发展,系统级测试已成为软件质量的重要组成部分。在市场竞争日益加剧的情况下,提高产品测试效率已成为关键问题。尽管软件自动化测试的理论方法和工具越
城乡规划在信息化技术、互联网+、5S技术与业务流高速推进下不断创新。城乡规划管理信息化在全国已实现数字城市,正迈入智慧城市的快速发展阶段,同时大型城市开始海绵城市的
网络信息的海量,新的网络技术的不断出现,入侵行为的多样化,大量的新的入侵的出现使得目前的入侵检测系统的检测性能低下,误报率高,达不到网络安全防护要求。本文研究的是基
本课题重点研究基于嵌入式的网络实时传输系统,在深入分析和研究了嵌入式操作系统及视频压缩编码算法后,针对现有的各种数据传输协议存在的不足,提出了一种新的基于用户体验
网络发展日新月异,精确的进行网络流量分类也变得越来越重要,因为很多应用使用随机的端口号,而且基于安全的考虑,也使用了加密的数据,传统的基于端口号或者是基于特征串的网
近年来,大量和潜在无限的数据流是由实时监视系统、通信网络、Internet传输信息、网页点击流、金融市场的联机事务处理和其他动态环境产生的。与传统的数据集不同,数据流是按
由于XML具有良好的数据格式、可扩展性、高度结构化、便于网络传输等特性,这些决定了它是一项卓越的应用广泛的技术。本论文以网络考试系统为应用对象,对XML及相应技术进行了
软件即服务(Software as a Service,SaaS)以网络为载体、以云计算为依托为用户提供软件租赁服务,具有价格低廉、部署迅速和配置灵活的特点,是未来软件业发展的重要方向。由于
随着计算机技术和电子通讯技术的快速发展,嵌入式系统的应用日益广泛,嵌入式产品已经进入到人们的日常生活中,并将有更广阔的发展前景。ARM作为嵌入式系统的主流微处理器,在
随着信息技术的快速发展,管理者在进行决策分析和制定时不能单纯依靠以往的经验,必须借助必要的数据来进行科学的管理。这导致管理人员进行决策分析时对数据的依赖性更加强烈