基于概率的XML数据理论的研究

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户:hdydrd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着半结构化的概率数据的广泛应用,针对半结构化概率数据的理论研究是必要的。XML数据成为一种新的网络应用的数据形式,成为Internet中进行数据交换和表示事实上的标准的形势下,研究基于概率的XML数据理论具有较强的理论研究意义和应用价值。本文针对概率XML数据的管理问题,借鉴概率关系数据管理的思路和方法,对概率XML数据的管理理论涉及到的概率数据在XML数据中的表示方法、概率关系数据与概率XML之间的转换问题、建立概率XML代数操作集合、XQuery查询语言的概率操作扩充函数和元素节点的查询算法等几个方面进行了较系统的、较深入的研究。由于基于关系的概率数据是一种经典的概率数据形式,研究基于关系的和基于概率的XML数据的转换理论是有必要的。XML树和XML图是两种常用的XML数据模型,文中把基于概率的XML数据表示为概率XML数据树,提出了基于关系的和基于概率的XML数据的双向转换算法,该算法分为两个部分,一是模式转换,二是数据转换。在研究转换策略的基础上,提出了概率关系模式与概率XML模式PDTD的双向模式转换算法,并提出了概率关系数据转换为概率XML数据树和概率XML数据转换为概率关系数据两个数据转换的算法。在理论上对算法的正确性和完备性进行了证明,并通过与概率XML数据和概率关系数据的转换对比验证了该算法的正确性和完备性。设计概率XML数据的查询代数操作集合是实现概率XML数据库查询及查询优化的基本方法。将概率XML单元树作为概率XML数据代数的基本操作单位,其模式为概率XML模式树,设计了对遵循概率XML树模型的概率XML数据的集合的基本操作集合。给出了基于解析的路径表达式集合的各个基本操作的算法,在理论上对算法的正确性和完备性进行了证明,并通过实例验证了该算法的正确性。Xquery语言是XML数据的有效的查询语言之一,为了支持概率XML数据的查询,扩展Xquery的函数是一种简单的概率XML数据查询的实现方式。提出了扩展XML的查询语言Xquery函数的概率化的函数形式eXquery,按照扩展Xquery函数的功能分类的形式,设计了与路径表达式有关的函数、与节点有关的函数和与树类型有关的函数等。元素节点概率的查询是概率XML数据查询的主要内容之一,研究概率XML数据树的元素节点概率算法是必要的。在分析查询策略的基础上,提出了基于可能世界原理的查询算法和基于路径表达式集合的查询算法两大类算法,在理论上对该算法的正确性和完备性进行了证明,并通过实例验证了该算法的正确性,分析了算法的概率XML数据大小的适用性。
其他文献
我国近代科学先驱徐寿首先倡议建立江南制造局翻译馆,系统译出近代化学专著,创立化学元素汉译名原则,参与创办上海格致书院和《格致汇编》,成功地运用铅室法制硫酸和用近代科
[目的]测定并分析不同地区啤酒糟的基本成分。[方法]测定了来自甘肃兰州(2012-B-001)、内蒙古呼和浩特(2012-B-002)和陕西西安(2012-B-003)3个地区啤酒糟的基本成分,并与葡萄
目的:流式细胞术是一种对大量细胞的物理和化学特性进行快速分析的技术。通过将荧光标记的抗体与细胞结合,并对细胞在激光照射下的光学信息进行分析,流式技术在细胞癌变诊断
目的探讨高频超声评价轻度狭窄的颈动脉粥样硬化斑块的稳定性在缺血性脑血管病中的临床应用价值。方法选取2017年4月~2017年7月本院收治的轻度狭窄颈动脉粥样硬化斑块患者100
本文围绕着混合曲线曲面造型中的三角混合曲面的设计、混合曲线的几何特征图分析和样条正交性问题进行了深入研究,主要获得以下一些结果:1.在三角混合曲面设计方面.现有的混合
对凝固过程中流场、应力场、温度场及微观组织形态进行数值模拟,能帮助工艺设计人员分析不同时刻凝固过程的温度分布、金属流态、结晶晶粒大小、应力分布等重要物理参数,从而
介绍了TDC与矢量控制驱动系统的硬件组成及控制结构,分析了位置控制的原理和实现方法。仿真及应用结果表明,该系统具有结构简单、响应快速、控制灵活、对应参数变化及扰动不
随着移动定位技术以及空间索引技术的不断发展,基于位置的服务也在越来越广泛的领域内得到了应用,例如在户外运动、旅游、物流运输甚至电子游戏等方面。基于位置服务的快速发
伊拉克战争后的石油形势凸显我国能源安全方面潜伏的危机,主要表现为我国未来能源需求与能源资源储量不足之间的矛盾。同时,我国能源结构中以化石燃料为主所造成的环境问题也