论文部分内容阅读
随着Internet/Intranet的飞速发展,以Internet为核心的计算平台使数据库应用环境发生了巨大的变化,大多数信息已不再局限于传统的结构性形式,而是以诸如电子邮件、图像、视频/声频对象、工作流等非结构化的形式存在着,并呈指数级激增,众多领域对于这类信息的应用范围日趋扩大,其处理要求也在进一步向检索、事务处理等更深入的方向发展,基于Internet/Web的应用向传统的数据库领域提出了前所未有的挑战。面对这些日益增长的处理需求,亟需研究新型的非结构化信息存储系统,并在系统内部实现必需的事务处理技术,以支持纷繁复杂的电子商业、贸易等领域在Internet级别上对于非结构化信息的应用。 事务是数据存储系统的逻辑工作单元。事务管理是数据存储系统保证其完整一致、实现信息共享的重要手段。系统通过对事务处理的支持,保证系统中一切事务的原子性、一致性、隔离性和持续性,使存储系统始终处于一致性状态。 作为对非结构化信息存储系统的事务处理研究的探索,本文提出了一种基于XML的非结构化信息事务处理的初步解决方案。 本文首先介绍了事务在传统数据库中的处理技术及其故障恢复和并发控制理论,其次,分析和探讨了XML技术在描述、存储非结构化信息方面的优势及其与非结构化信息相结合的必然性。 在上述相关理论的支持下,本文以一个基于本体(Ontology)的XML文档表示模式的非结构化信息存储平台为基础,将传统的登录日志、封锁调度等理论运用到非结构化信息存储系统中,并结合实际情况对上述技术加以改进,在采用自行设计的非缓冲型逻辑日志和物理日志记录相关事务信息,降低封锁粒度,使用两级检查点机制控制缓冲区与磁盘数据的同步等技术的基础上,提出OBSA-TPS事务处理系统模型,将该模型划分为事务管理、事务处理、缓冲区管理及磁盘存储等几个模块,并对各主要模块进行了设计和初步实现。 最后,笔者以上述技术理论为指导,结合JAVA及XML技术,在湖北省教育厅科研资助项目——“基于XML的WEB存储系统研究”的研究开发过程中,初步实现了本文所提出的OBSA-TPS事务处理系统模型。