论文部分内容阅读
在需要知识共享的语义网中,本体是解决语义层次上的信息共享和重用的基础。本体编辑器作为对领域知识建模的必要工具,能帮助领域专家完成对本体的创建、解析、存储和重用等工作,是本体管理系统中的重要组成部分。但随着领域知识的丰富,大规模本体的开发要求不同领域专家进行协同。目前常用的本体开发工具如Protégé对协同工作的支持有局限性,难以支持不同领域专家对大规模本体的协同开发。另一方面,大规模本体常常涉及海量的非结构化信息,如何从海量的非结构化信息中识别和抽取本体实例也是一个亟待解决的问题。针对上述问题,本文在深入分析本体描述语言OWL(Ontology Web Language)的基础上,提出了一种基于角色和事件的协同本体开发机制;给出了一种基于UIMA(Unstructured Information Management Architecture)规范的从非结构化信息中识别和抽取本体实例的方案。在此基础上,进一步阐述了支持协同编辑的分布式本体管理系统的设计与实现,该系统以开源本体开发软件Jena和Protégé为基础,采用Ajax技术,实现了对本体的协同编辑和语义一致性维护,支持本体的分布式管理、支持从文本等非结构化信息中获取相关实例。与其它本体管理系统相比,本文具有以下特点:提出了一种基于角色和事件的协同本体开发机制。该机制根据OWL规范将本体开发的角色分为本体工程管理角色、类编辑角色、属性编辑角色、实例编辑角色、推理本体角色和规则编辑角色等类别,利用事件处理机制以松耦合的方式实现不同角色对大规模本体的协同编辑。给出了一种基于UIMA规范的从非结构化信息中识别和抽取本体实例的解决方案。该方案将本体相关类与非结构化信息分析引擎相关联,首先利用基于UIMA的分析系统对非结构化信息进行信息抽取和标注,然后通过扩展UIMA基本类型系统将标注结果转换成本体实例。支持协同编辑的分布式本体管理系统基于Ajax技术,具有开放的体系结构,可实现本体管理与基于UIMA的实例抽取的有机结合。