论文部分内容阅读
本体作为解决网络资源语义异构问题的重要途径,其构建方法没有统一规范和标准,人们在开发新本体同时,也带来了本体异构的问题。本体映射便是解决本体异构问题的手段之一,其关键过程就是计算概念之间的相似度,以此来衡量两个概念之间的相似程度,建立语义联系。目前已出现很多本体映射方法和概念相似度计算方法,这些方法存在一些问题,如计算量大、映射效果差等。围绕这些问题,本文的主要工作如下:首先,本文对本体映射相关技术及概念相似度算法进行了研究和介绍,在此基础上,针对常用相似度算法中影响因素考虑不全面、计算复杂等问题,介绍了一种基于语义距离、语义重合度和节点层次差的语义相似度计算方法,并分析了该算法中语义距离计算不精确的问题,提出了一种依据节点密度、节点深度和节点间边的类型分配权值的改进算法,提高相似度准确性。同时引入WordNet语义词典,提出了一种将异构本体两个概念在词典中定位的方法,并利用改进的语义相似度算法计算概念在WordNet中的相似度。随后,本文针对现有映射方法中存在的相似度计算概念特征考虑不全面、计算量大导致映射效率低以及通用性不高等问题,提出一种基于综合相似度计算的本体映射模型。该模型首先利用基于WordNet的改进的语义相似度算法而得出的名称相似度结果提取候选映射对,减少计算量,接着计算候选映射对基于属性、结构和实例的相似度,进行加权综合后输出最终映射对。最后,利用OAEI(Ontology Alignment Evaluation Initiative)组织提供的测试集,设计了实验系统,分别采用改进算法和未改进算法计算概念语义相似度,并对结果进行分析比较,同时对本文提出的映射模型得出的映射结果在查全率、查准率和F-measure值上与其他系统进行对比。从分析结果中可以看出,改进的算法准确性更高,能更好地区分概念间的细微差异;而本文提出的映射模型在大幅度减少计算量的同时,在一定程度上保证了映射结果的查全率和查准率,具有较好的性能。