论文部分内容阅读
现有的网络WEB页面大部分是由HTML页面组成,这些页面的内容对于人类而言是可理解的,但对于机器而言是不可理解的,这使得机器很难自动处理WEB上的内容,而网络上内容的急剧增长迫切要求计算机能够对网页内容进行自动理解和处理。为了解决这个问题,Tim Berners-Lee等人提出了语义WEB的设想。语义WEB是现有WEB的扩展,它不仅是一个展示信息的平台,而且它上面的信息可以由计算机理解并推理。本体是语义WEB的基础,它通过描述WEB资源的概念及相互之间的关系,使得机器能够理解WEB的内容并做推理。本体是共享概念模型的明确的形式化规范说明。本体使不同开发工具和应用平台的信息之间能够进行通信、共享和重用。近年来,语义WEB与本体受到了广泛的关注,已经在生命科学、软件工程、智能交通和社会科学等领域得到广泛的应用。本体连接(Ontology Connecting)是指当用户的查询涉及多个本体时将本体信息组合起来,而不是将多个OWL文件合并起来,其作为本体重用的一种方式,不仅能够解决知识共享的问题,还为构建、维护和扩展本体或知识库提供新的思路和方法。本体连接保证了本体操作的灵活性和推理效率,同时也使得后期的本体维护更加方便快捷。多本体的连接能够广泛运用于本体工程、软件工程及知识工程等诸多领域。本体连接大体上可以分为两种情况:一是根据知识所属的不同领域构建出多个本体模块,然后将多个模块连接起来,这就是所谓的本体模块化思想。在这种情况下,确定整个知识范围及每一类知识属于哪个领域是构建该领域本体库的基础。二是将一些规模较小的单独构建的相互之间没有依赖关系的本体组合成一个大的模块。这个时候,任意的两个本体都可以连接成一个规模较大的模块化本体,它更加贴近本体重用的思想。本文主要研究第二种形式的本体连接。在语义网上,信息源用本体来描述它们的信息,信息的构建和重用是通过将这些本体连接成一个本体库,在这个本体库里面,信息都可以用一种统一的形式进行解析。第一种情况是针对领域本体构建之前的,是构建本体的过程中非常有用的指导思想。然而,在我们使用本体之前,我们首先要考虑网络上是否存在可以直接利用的本体,如果能将这些本体连接起来,重用别人已经构建的知识库,或者是重用所要连接的本体中的一些相关数据,而不必重新费时耗力地构建新的本体,这样就更加贴近本体重用的思想。本文的研究主要包括以下几个部分:(1)中国-东盟博览会信息本体库的构建。深入研究国内外现有的本体构建原则与方法,针对中国-东盟博览会信息资源(如中国-东盟博览会信息网站上的信息)和目前国际上已有的本体规范(主要是Web本体语言OWL2),构建中国-东盟博览会信息本体库,在本体库的基础上,利用描述逻辑推理工具(FaCT++)实现基于语义的东盟博览会信息搜索服务。(2)link属性和连接规则的定义。初步学习ε-connections理论和桥规则理论,并将其引入跨领域多OWL2本体中。ε-connections理论是专门为抽象描述逻辑系统设计的框架逻辑。该理论运用了描述逻辑的知识,能够实现OWL2本体的连接。(3)多个0WL2本体连接的实现。利用link属性和连接规则,使用支持ε-connections理论的本体编辑工具—Swoop实现中国-东盟博览会信息本体、汽车商务本体和旅游领域本体之间的连接。(4)中国-东盟博览会信息检索平台的实现。为了验证本研究的相关理论,本文设计并初步实现了中国-东盟博览会信息检索平台,该平台可以回答用户关于中国-东盟博览会信息的绝大多数提问。