论文部分内容阅读
语义网环境的诞生,为信息检索技术开辟了一条新的途径,它可以在知识理解和知识推理的基础上实现对信息资源的准确、全面的检索。用于在语义和知识层面上描述领域概念模型的本体,具有良好的概念层次结构和对逻辑推理的支持,可以为信息查询提供较好的语义支持,来实现信息的语义查询,而把本体的概念借用到信息检索中,具有非常重要的意义。它为领域知识的创建和共享提供了一种灵活、全面的描述。语义网为信息资源、本体的描述、存储以及知识推理和信息的安全性提供了一整套的保障机制。在信息检索系统中,我们需要为存储信息添加相应的语义信息来向计算机给出其含义。为了探究信息检索中的信息存储,则又需要涉及倒排索引这一重要的存储机制。
针对以上背景,本文通过对现有信息检索技术的分析及语义网本体技术的研究,对于信息检索系统中的文本索引表机制做了大幅度的改善,从结构到存储内容都有进一步深入探讨。第一,本文以北大天网搜索引擎为基础,从原先的两层结构提高到了三层的规模机制,虽使得结构更为复杂,但提高了搜索的查准率,而新增的那层用于对本体表达项进行索引;第二,对本体的构建提出自己的看法,过程中需要进一步改进;第三,融合了并行机制,引入了消息传递接口;第四,借助WordNet的强大功能,利用其中的参数作为比较参数,设定相应阈值来规范所收集的词汇规模。本文从语义本体入手,总结了语义检索研究的两条思路,选取了语义网环境下基于本体的语义检索作为文本的研究重点;然后介绍了语义网的结构及其对语义检索的意义;接着对语义网涉及的本体和描述语言进行深入的探讨和研究,为语义检索系统的实现奠定基础。