论文部分内容阅读
随着计算机网络技术的飞速发展,互联网已经成为获取和发布信息的重要渠道,越来越多的信息通过网络进行交换和共享。作为一种跨平台的可扩展标记语言,XML得到了广泛的应用,已经成为互联网上数据描述与交换的事实标准。为了标准化XML数据查询和处理,国际万维网(W3C)发布了XML数据查询语言的标准XQuery语言。如何高效地实现XQuery语言已经成为研究的热点。不同于关系数据,XML是一种半结构化的数据。针对XML数据的查询请求中包含了多种结构约束关系。这些结构关系往往互相关联,形成一个树型的查询模式。这种树型的查询模式广泛地出现在XPath和XQuery语言所描述的XML查询请求之中,称为XML树模式查询(Tree Pattern Query,TPQ),或者叫做小枝查询(Twig Query)。TPQ是XML查询的核心操作,也是XML查询相关研究的热点。将XQuery语言描述的查询要求尽可能多地包含在XML树模式查询中,有助于提高XQuery程序的执行效率。提出一种描述能力更强的扩展树模式GTP++,支持强弱绑定,谓词以及与、或、非逻辑运算。同时,提出了一种有效的XML树模式识别算法,能够从XQuery程序的for/let子句和return子句中嵌套的FLWOR表达式中收集各种结构约束,并将这些结构约束合并成单个XML树模式,与现有的识别算法比,更多的结构约束可以包含在单个XML树模式中。这种方法减少了XQuery程序查询过程中TPQ的执行次数以及对XML文档的遍历。此外,还提出了一种面向GTP++模式的树模式查询算法。