论文部分内容阅读
信息集成就是要从多个自治的,分布的异构数据源中获取信息,建立多数据源的全局统一视图,而无需考虑数据类型、数据存储、物理位置等影响因素,随时随地提供对数据统一、透明的访问,为用户提供有效的查询方式,最终实现信息共享。信息集成主要需要解决以下几个方面信息的异构问题:系统异构、结构异构、语法异构、语义异构。 传统的分布式信息集成着重于处理信息的系统异构和结构异构,缺乏一种有效的消除信息语义异构的方法。信息源的自治性、异构性与领域相关性是造成信息语义异构的主要原因,语义异构已经成为当前信息集成的主要瓶颈问题。 本体(Ontology)是共享概念模型的明确的形式化规范说明,通过描述概念及概念之间关系来描述概念的语义。作为一种有效表现概念层次结构和语义的模型,Ontology被广泛运用到计算机科学的众多领域。语义冲突是指当描述同一现实世界事物时,两个对象在描述方式和内容上的不同而造成的冲突。本课题将语义冲突分为数据层冲突和模式层冲突两大类,定义并讨论了各种类型的语义冲突,并通过对各类语义冲突的分析,提出了一种基于本体的语义冲突解决方案。该方案定义了一个基于公共概念的冲突处理本体(CCSOL),通过比较本体间概念的相似程度的方法自动地检测语义冲突;借助领域专家定义推理规则,通过在上层本体和领域本体间、领域本体与实例间建立模式映射的方法,消除语义冲突,从而解决信息集成的语义异构,实现集成系统的语义一致性。 在此基础上,本课题提出了一个的语义信息集成模型,该模型以信息集成中最主要的查询操作为核心,由用户层、中间层、信息层构成,使用本体和基于本体的智能代理来响应用户查询。将全局查询形式的用户查询转换成针对不同的信息源的子查询,并按不同信息源的领域本体对子查询进行本体转换,籍此实现基于语义的查询操作。