信息检索系统中基于本体倒排索引表的研究

来源 :上海大学 | 被引量 : 0次 | 上传用户:meomeo38
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语义网环境的诞生,为信息检索技术开辟了一条新的途径,它可以在知识理解和知识推理的基础上实现对信息资源的准确、全面的检索。用于在语义和知识层面上描述领域概念模型的本体,具有良好的概念层次结构和对逻辑推理的支持,可以为信息查询提供较好的语义支持,来实现信息的语义查询,而把本体的概念借用到信息检索中,具有非常重要的意义。它为领域知识的创建和共享提供了一种灵活、全面的描述。语义网为信息资源、本体的描述、存储以及知识推理和信息的安全性提供了一整套的保障机制。在信息检索系统中,我们需要为存储信息添加相应的语义信息来向计算机给出其含义。为了探究信息检索中的信息存储,则又需要涉及倒排索引这一重要的存储机制。 针对以上背景,本文通过对现有信息检索技术的分析及语义网本体技术的研究,对于信息检索系统中的文本索引表机制做了大幅度的改善,从结构到存储内容都有进一步深入探讨。第一,本文以北大天网搜索引擎为基础,从原先的两层结构提高到了三层的规模机制,虽使得结构更为复杂,但提高了搜索的查准率,而新增的那层用于对本体表达项进行索引;第二,对本体的构建提出自己的看法,过程中需要进一步改进;第三,融合了并行机制,引入了消息传递接口;第四,借助WordNet的强大功能,利用其中的参数作为比较参数,设定相应阈值来规范所收集的词汇规模。本文从语义本体入手,总结了语义检索研究的两条思路,选取了语义网环境下基于本体的语义检索作为文本的研究重点;然后介绍了语义网的结构及其对语义检索的意义;接着对语义网涉及的本体和描述语言进行深入的探讨和研究,为语义检索系统的实现奠定基础。
其他文献
跨语言信息检索是指用户用某种语言从另外一种或多种语言表达的文献信息集中检索出所需文献信息的方式或技术。研究目的是希望在信息时代,克服语言壁垒,提供跨语言的文献信息检
FPGA(Field-Programmable Gate Array)作为一种半制定电路,不但解决了专用集成电路功能逻辑灵活性的不足,同时克服了原有可编程器件门电路数量十分有限的缺点。越来越广泛的用于
基因拼接是生物信息学领域研究的基础课题之一,也是一个难度较大但十分有意义的研究课题。基因拼接是指从给定的基因序列集合出发,利用计算机技术,再重新构造出该生物DNA序列
重复体识别是生物信息学中分析基因组序列的主要手段之一。在真核生物基因中重复体DNA占据了非常重要的地位。通过识别重复体可以发现基因组的进化规则和许多疾病的遗传规律
平标签网络体系架构是由美国加利佛尼亚大学伯克利分校的Matthew Caesar等人提出的一种全新的网络结构模型。该网络模型给出了一种新的网络标识结构的设计,力图从源头上杜绝
增强现实技术(Augmented Reality,AR)是随着虚拟现实技术(Virtual Reality,VR)的迅速发展和实际应用需要而出现的一种将真实世界信息和虚拟世界信息“无缝”集成的新技术,是一种
公钥密码技术是网络安全技术中一项非常关键的技术,它在密钥管理、数据加密以及数字签名与认证中起到不可替代的作用,基于MQ问题的多元多项式公钥密码体制(MPKC)由于其自身安
网格计算是近年来分布式计算在科学研究领域和商业领域的新的研究和发展趋势。网格计算系统的部署使企业的闲置计算资源得到充分利用,省却了企业在超级计算机上的投入,使得企业
计算机动画是把一系列静态图片有序排列形成连续的动态画面的过程,每一幅图片即是一帧。渲染是把三维几何模型转换为图片的过程,非常的耗时。网格技术的出现和发展,为其高效渲染
平台识别是目标识别的关键技术,针对平台识别具有不确定性和难于进行并行推理的特点,将模糊Petri网的形式化推理方法应用于平台识别,利用它的并行处理能力对平台识别进行高速处