论文部分内容阅读
随着需求的扩大,技术和应用的发展,信息系统开始跨领域,其复杂性越来越高,规模越来越大。为此,元数据开始扮演越来越重要的角色。而元数据技术中最核心的问题之一是如何定义元数据模式和如何有效管理元数据,本文聚焦在这两个主题上。针对现有的元数据标准的单领域运用的缺陷,本文着眼于对经典的Dulin Core-Gov和GILS标准的改进,在研究分析Dulin Core-Gov和GILS标准的基础上,以2010年上海世博会为样例,提出了一个兼顾领域需求和通用性要求的EXPO元数据模式,该模式从语法、语义和语用三个层面刻画了类似于2010年上海世博会这类复杂信息系统所需的元数据,解决了既面向领域又具有普适性的问题。同样的,在元数据管理方面,虽然已经有了不少的元数据管理工具,但是对于跨系统跨领域的元数据管理,总是很不尽如人意。因此本文针对EXPO元数据模式,结合EXPO2010的特点,提出了一个集合元数据自动抽取技术,元数据知识管理技术,EXPO本体编辑技术的兼顾领域需求和通用性的元数据管理系统,该元数据管理系统实现了对EXPO元数据模式的实践应用。本文的主要研究成果可以归纳为:1.提出了一个兼顾领域需求并且具有通用性要求的EXPO元数据模式。2.提出了一个集合元数据自动抽取技术,元数据知识管理技术,EXPO本体编辑技术的兼顾领域需求和通用性的元数据管理系统,该系统实现了EXPO元数据模式的实践和应用。3.在元数据知识管理技术中,设计和实现了具有元数据一致性检测和语义验证,同时可以利用EXPO本体编辑器对元数据进行知识补充等多功能的新概念的元数据编辑器。4.在EXPO本体编辑技术中,在前人研究的基础之上给出了基于WordNet和聚焦爬虫的概念相似度算法来半自动构建和完善EXPO本体。这种构建方法更能反映本体建模者的意图,降低构建本体的复杂度。本论文受上海市科技攻关项目-2006年度“登山行动计划”项目国际合作计划“基于元数据管理的世博知识共享系统研究”(编号:065107042)支持。