论文部分内容阅读
随着Internet的迅猛发展,电子商务、远程教育和网络出版等全新的应用逐渐发展成为互联网世界重要的组成部分,大量的应用基于网络展开。作为一种全新的标记语言,XML以其扩展性、结构性、平台独立性和自描述性等诸多特性逐渐成为网络上数据表示和交换的事实标准,越来越多的应用使用XML来存储、交换和发布信息,大量XML数据的出现给XML的存储带来了巨大的挑战。目前对于XML数据存储主要以数据库的方式进行组织。由于关系数据库成熟的技术和广阔的市场占有率,成为XML数据存储的首选之地。本文在研究分析各种映射技术的基础上,设计并实现了一个基于映射标签的XML与关系数据库间的存储与重构的原型系统MyXSLR。通过扩展XMLSchema文档,将预定义的映射标签添加到文档中定义的各个部件中,使得每个部件的映射信息独立于其他部件,从而保证系统能够支持多种映射策略组合的混合方式。同时,本系统利用映射信息库,不再以硬编码的形式映射XML文档,大大地增加了映射的灵活性。本文设计的MyXSLR原型系统为XML与关系数据库间的双向转换提供了软件工具,它使得数据能够方便地在XML和数据库两种载体间进行转换,从而充分利用这两种数据表现形式各自的优点和长处,弥补各自的不足。本系统主要包括以下四个子系统:●带映射信息的XML Schema解析子系统●关系模式生成子系统●文档数据载入子系统●文档重构子系统带映射信息的XML Schema解析子系统用来提取Schema模式信息和映射信息,形成映射信息库,并记录下元素间的原始次序和嵌套关系,为重构提供必要信息;关系模式生成子系统负责在数据库中生成映射表结构,为XML数据入库做好准备;文档数据载入子系统提取文档的实际数据,形成记录插入表中,完成XML数据到关系库的转换;重构子系统利用映射信息库和库中的数据,完成关系库到XML数据的转换。特别地,重构功能的存在,不仅验证了XML数据载入的有效性和信息完整性,也使得原始XML文档真正成为冗余数据。