论文部分内容阅读
经过近十年的发展,语义Web在许多应用领域取得了阶段性的成功,但是它距离真止的实际应用仍有一个很长的过程。一个主要原因在于,目前Web上绝人多数数据仍然以关系数据库的方式存储,使得以本体为基础的语义Web应用程序难以便捷地访问和操纵这些数据,以至于限制了语义Web的发展。因此,如何在语义Web环境下实现关系数据库和本体间的互操作是语义Web研究中的一个重要问题,其中的一个关键技术是实现关系数据库模式和本体间的匹配。
针对上述研究问题,本文将基于虚拟文档的本体匹配方法应用于关系数据库模式和本体之间的匹配,特别地,提出了一种针对关系数据库模式的虚拟文档构建方法。该匹配方法的主要思想是构建待匹配关系数据库模式和本体中元素的虚拟文档,利用向量空间模型计算虚拟文档之间的相似度,从而得到对应元素之间的相似度。该方法的技术特点在于,虚拟文档构建过程中,不仅考虑元素自身的描述信息,还引入相邻元素的描述信息。这样的优点是,在考虑元素语言学特征的同时,还在一定程度上考虑了关系数据库模式和本体的结构特征。
另外,本文还尝试了一种基于中间模型的匹配方法,其主要思想是通过引入中间模型,协调关系数据库模式和本体在模型上的差异。该方法首先将关系数据库模式和本体分别转换为中间模型,然后在中间模型的基础上,基于初始匹配对,采用基于结构的相似度传播算法,进一步计算元素之间的相似度。
基于以上两种方法,本文设计实现了一个关系数据库模式和本体间的自动匹配工具MASON。实验表明,通过构建虚拟文档的方式实现关系数据库模式和本体间的匹配是一种行之有效的方法,而基于中间模型的匹配方法效果一般,对匹配效果地提升有限。