论文部分内容阅读
随着可扩展标记语言XML应用的普及,对XML文档查询的要求也就越来越高。如果不在XML文档上建立索引结构,那么针对XML数据的任何查询都很可能导致对整个文档树的遍历,对于海量的XML文档,这种遍历所花费的开销巨大。因此,建立高效索引、提高XML文档的查询效率成为近来研究的热点。 通过研究XML数据的特点,设计了一种基于Schema的XML索引方法。主要开展了四个方面的研究工作:节点编码方法的设计、索引结构的设计和存储、路径查询的实现及索引的维护。 节点的编码主要以现有的区间编码方法为基础,加以适当改进,增加了几个新的字段,以支持XML文档节点的更新,为XML索引模型提供了编码维护方案。 以编码方案为基础,结合倒排索引和路径索引的思想,为该索引设计了合理的数据结构,以及在关系数据库系统中的存储模式。 为有效实现路径查询,以所设计的索引结构为基础,拟定了XML数据库各种查询操作的步骤,主要包括Schema文档的预处理和XML文档结构匹配两个阶段,并提出了相应的结构连接算法。 为了支持用户更新XML文档,提出的增加文档的索引维护算法和删除文档的索引算法不仅实现了对XML文档在数据库中存储的更新,还实现了对XML文档本身的保持约束更新。 在达梦XML系统的基础上,设计并实现了基于Schema的XML索引系统,实验结果表明,该索引方法能够有效地提高XML的路径查询效率。