论文部分内容阅读
随着数据存储技术的不断发展,许多企事业集团都积累了大量的异构数据源,遗留下在不同的数据源上用不同技术开发的应用程序。异构数据集成是近年来数据库研究领域的热点,它的目标就是针对这样的遗留数据源进行集成处理,既维持原有应用程序的正常运行,又能在这些异构的数据源上建立新的集成应用。
“基于Mediation的Web异构数据集成研究”是天津市自然科学基金资助的项目,已经进行的前期工作取得了很大成果[18][19][20]:总结出三种集成技术PULL型、PUSH型和HYBRID混合型;开发出两个原型系统HDIS和Exceed。HDIS使用查询下推的PUSH方式查询数据,对外表现为一个关系型数据库,Exceed使用数据预抽取的PULL方式,对外表现为一个XML型数据库。
本文在实验室前期研究的基础上,继续沿用HDIS这种查询下推的更清晰灵活的轻量级体系结构,对它进行设计和功能上的调整和改进,实现了原型系统GHDIS。主要的工作有:
参考Exceed中使用XML方式集成数据的技术,将HDIS的虚拟数据库部分进行改进,采用国际上流行的XML集成标准建立虚拟XML映射视图,将原有的中间虚拟关系型数据结构改造为虚拟XML数据结构,提供XQuery查询接口,对查询访问继续使用PUSH查询下推模式,既扩大了HDIS集成非关系型数据源的能力,又避免了Exceed中查询预抽取的性能损失,也避免了HDIS中需要用户使用类SQL语句查询,返回XML结果集的矛盾。
增强HDIS的数据操作功能,提供对底层多数据源之间的联合查找,不需要考虑集中的通用模型而损失各数据源独有的信息。对于可更新数据源的数据更新操作进行了尝试,增加了集成操作数据的能力。
对于异构数据集成中的热点问题如安全问题进行了尝试,根据XML技术的特点,增加了用户、权限、名字空问等多数据库实例及安全方面的管理处理。对于流行的分布式的异构数据集成体系结构也进行了尝试。