论文部分内容阅读
随着信息技术的发展,Web上的数据日趋成为当今数据的主流,但是分布在Web上的数据多是异构的,并不是真正意义上统一的可直接利用的信息资源,为了实现信息共享,必须有一种系统能够支持异构数据集成。异构数据集成的任务就是通过给用户提供一个统一的应用平台,从而屏蔽底层数据源的不同,使得用户可以无缝而且灵活的访问这些异构数据源。Web数据具有范围广、数量大、形式复杂、变化迅速等特点,传统的数据集成技术已渐渐不能满足Web异构数据集成的要求,近几年兴起的Web Service技术是一种新的分布式计算技术,建立在XML技术基础上,XML本身具有的与平台无关、易于扩展、交互性好等特性,能够为Web异构数据的集成提供强有力的支持。本文首先分析和研究了数据集成中的技术,包括Web Service技术中的WebService架构模型、协议规范、特征和优势以及XML技术中的XML相关工具、标准体系、模式、查询语言和解析器,重点深入研究了XML查询语言和XML解析器。本文下一步对异构数据集成技术进行了深入地研究,包括异构数据集成的定义、所面临的问题以及异构数据集成的方法,重点对数据仓库法、联邦数据库法和虚拟视图法三种常见的数据集成方法进行了深入地分析和对比,选择虚拟视图法作为本文架构的基础。随后,基于数据集成中的虚拟视图法本文提出了基于Web的异构数据集成设计方案,详细全面地介绍了构成数据集成框架的三个层次,包括用户应用层、中介层和数据源层,重点研究了用户应用层中的Web Service的发布和查找技术、中介层中的XML查询分解算法、数据库中数据向XML转换的技术以及XML解析技术。最后,在总结全文的基础上,结合其它与集成系统相关技术的发展趋势,提出了若干有待进一步深入研究和分析的问题。