论文部分内容阅读
随着人们构建的本体的增多以及对本体研究的深入和实际应用需求的增加,本体的应用面临着一些新的问题。一方面是如何准确计算本体中概念之间的相似度;另一方面是如何解决异构本体之间知识共享的问题。这两个问题都与概念相似度计算方法直接相关。因此,概念相似度计算方法的研究对本体技术的发展和应用有重要作用。本文首先对本体以及概念相似度的研究现状做了介绍,然后对本体和概念相似度的相关技术进行了研究,对本体的研究主要介绍了本体的概念、构成要素,选择性的描述了本体语言、本体构建方法以及编辑工具;对概念相似度的研究包括相似度计算的原则、影响概念相似度的因素以及经典概念相似度计算方法的分析。然后,介绍了一种基于语义距离的多因素概念相似度计算方法,并分析该方法存在的问题,针对这些存在的问题提出改进的办法,得到一种基于距离和属性的概念相似度计算方法。基于距离和属性的概念相似度计算方法考虑了语义距离和概念属性两方面内容,在基于语义距离的相似度计算中不仅考虑了深度等因素的影响,还将它与信息论的观点相结合,考虑了密度因素对概念相似度的影响,以提高相似度的准确性;在基于属性的概念相似度计算中使用了Tversky计算方法,全面的考虑了概念的属性信息。随后,选定水果领域构建了一个实验本体,该本体主要描述了水果中的分类层次关系,并对各个概念的属性做了描述。最后,为了对改进的概念相似度计算方法进行验证,设计了一个简单的概念相似度计算系统,系统使用java语言设计,用Jena对本体进行解析,为了便于结果的对比,设计的系统不仅可以使用改进的方法计算相似度,而且也可以使用未改进的方法和其他两种相似度计算方法进行概念相似度的计算,之后对几种方法的计算结果进行对比分析。从对比分析结果中可以看出,改进的算法在整体趋势上和其他几种方法基本一致,但区分度更加明显,准确性更好,尤其在本体树结构子节点分布不均衡时效果会更明显。