论文部分内容阅读
随着数据库应用的不断深入,需要透明地访问和处理来自多个数据源中的数据的需求越来越多。但是,大多数数据源在物理和逻辑上都存在着很大的差异。传统的数据集成技术,已无法适应人们及时获取更多更新更全面数据的需要。因此,研究分布异构环境下多种数据源的集成即多数据库系统成为重要问题。
目前国内外还没有专门面向多数据库模型化访问的中间件产品,主要采用基于XML和面向对象数据库访问接口(如ODBC/JDBC/JDO)等权宜方法,没有规范化/服务化的数据库集成方法,没有上升到中间件的高度。本课题组提出的多数据库中间件DoD支持异源独立分布数据的“上推/受访/集成”的模型化,同时支持数据上推的“热插拔”、事件驱动、敏感识别、安全保密控制、并发控制、访问过程控制、输出整合等功能,从而,使异源独立分布数据的存取/复用/集成,能像单一关系数据库那样走向模型化,兼容标准SQL与面向对象数据库访问接口,建立“DBMS的DBMS”。
首先,本文介绍了多数据库技术的基本知识及研究现状,然后介绍了本课题组提出的多数据库中间件DoD模型。该多数据库中间件模型由数据源层、上推机层、集成机层及MDBServer层四部分组成。重点介绍了集成机层即多数据库中间件缓冲区系统。
其次,本文讨论了缓冲区系统的核心问题之一模式集成。由于局部模式间存在着不同的数据模式、不同的数据定义与操纵语言以及语法、语义等方面的转换问题,因此多数据库集成多数据库集成是一个需要深入研究的问题。本文提出了一个完整的模式集成的理论体系:公共数据模型;模式映射;模式集成代数;模式集成冲突的分类与消解。
再次,本文讨论了缓冲区系统的另一个核心问题事务处理。在多数据库环境中,存在全局事务、全局子事务和局部事务三种类型的事务,全局事务存取一个场地以上的数据,全局子事务和局部事务一起在成员DBMS中执行。由于成员数据库的分布异构特别是自治性,使得事务在多数据库环境中是个非常棘手的问题。本文从事务的基本特征入手,提出了维护事务的原子性、一致性和隔离性的解决办法,较好的解决了多数据库环境中的事务问题。
最后,本文给出了缓冲区系统的实现平台及主要的实现策略,重点给出了全局数据对象模型及其应用程序接口。并对课题研究成果进行了总结,提出进一步完善的思路。