基于领域本体和位置关系的检索模型研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:alovey
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网信息的飞快增长极大地改变了人们获得信息的方式,面对大量的互联网信息,如何才能够迅速、方便地获得有效信息,逐渐成为人们关注的问题。搜索引擎的出现极大地缓解了这一矛盾。搜索引擎是应用在因特网上的一种软件系统,它以特定的策略在因特网上收集和挖掘信息,然后对信息进行剖析、提取、组织等处理后形成供检索用的检索库。检索模型是搜索引擎的数学基础,它的工作是根据使用者的需求找出相关信息,在这之前需要将信息按照某种特定的方式进行组织。本体是对共享的概念模型的明确的形式化的规范的说明。它其实是一种特殊的术语集合,具备结构化特征,且更为适用于在计算机系统中使用。领域本体对某个特定领域或客观世界的一部分模型化。在各种信息检索模型中,最常用的是向量空间模型。但是,向量空间模型具有固有的缺点,所以有很多人根据需要对它进行了改进。改进的检索模型虽然取得了一定的效果,但效果仍不明显。在计算查询和文档的相关度时虽然考虑了领域本体或者词义网词典,但是没有将二者结合起来。此外,现有的检索模型也没有考虑查询词项位置特征这一重要因素,查询经过这些检索模型处理后得到的词项便失去了顺序先后关系和相邻关系。本文的工作和创新主要表现在以下几个方面:(1)收集了软件领域中的各种概念以及概念之间的关系,并用专业术语表达出来,作为软件本体的基本概念集,并按照语义词典的结构来把它们组织成语义关系网络。然后用Protégé手工构造软件领域本体,作为求概念相似度的一个参考。(2)通过将两个概念在词义网中关于根据信息理论得到的语义相似度融合到软件领域本体得到的相似度中得到了一种新的相似度算法。(3)将查询词项的位置关系作为求相关度时考虑的一个因素,提出了词序相关度和词语相邻相关度这两个概念,并对其进行形式化,然后对其进行初步的实现。(4)在本文构造的软件领域本体以及提出的概念的基础上构建了一个信息检索系统,然后对其进行了实现。实验证明本文提出的检索模型在查准率上有了较大的提高,同时本文提出的领域本体概念相似度计算方法求得的相似度也较为接近经验值。
其他文献
该文所关注的问题是如何建立、维护和优化Mesh,并在Mesh上建立数据分发树.这样,Mesh就成为覆盖了一个局域范围的层叠网络.通过连接到一个特定的Mesh节点,终端可以加入到多播
该文详细讨论了如何开发一套具有高度可扩展性,可重用性和高度可维护性的个体私营企业管理系统(简称个私协管理系统).在设计上,个私协管理系统采用面向对象组件式方法进行设
该论文给出了一套用于足球机器人的本地视觉系统(localvisionsystem)的设计和实现方法.足球机器人的比赛环境是用特定颜色标记的,各个场景目标都用特定的颜色表示,因此目标识
随着计算机网络的高速发展,计算机网络的作用已经不仅局限于办公或工业控制,而且开始进入人们的生活领域。学术界近年提出了“Bringing the Internetto Life”,即“把互联网带到
该文首先介绍了空间数据的服务的特点,接着对现有的分布计算模式进行了阐述,之后简介了移动Agent技术及其研究现状.在此基础之上提出了基于移动Agent的分布式空间数据检索模
针对银行、公安等领域对网络监控系统的迫切需要,该文在研究数字视频压缩技术、组网技术和数字视频网络传输技术的基础上,提出一种基于视频服务器的网络数字监控系统的系统方
全局路径规划是智能水下机器人(Autonomous Underwater Vehicle,简称AUV)的关键技术之一,在一定程度上它标志着水下机器人智能水平的高低。本文对大范围海洋有流环境下智能水下
该文在前人研究的基础上,提出了一个基于体育视频对象自动分割系统.该系统首先利用自适应平滑滤波特征增强的边缘提取首帧的边缘,对后续帧采用了光流定位Snake模型初期轮廓动
该文针对现代电子商务系统对现代物流的要求,分析了在国内把航运系统纳入现代物流需要作的基本事件.在分析了长江航运10多年信息化推广过程中的经验和不足的基础上,设计了符
该文中设计了一个应用于Internet/Intranet的多层结构组件化WebGIS.在客户端利用ActiveX控件实现前端用户界面,通过调用方法来获取地图数据,并完成用户对地图的基础操作,并不