并行XML数据分片与查询处理技术研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:Yeah12345678
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的发展,XML正逐渐成为数据表示和信息交换的公认标准.如何高效存储和查询以M字节、G字节、T字节以及P字节计的大规模XML文档数据,正受到学术界和工业界研究人员的极大关注.毫无异议,并行数据库技术为上述问题提供了有效且可行的解决手段.正是在这种研究背景之下,我们比较深入地研究了与并行XML数据库相关的一些问题.首先,提出了两类物理分片策略:基于数据模式的物理分片策略以及基于查询频率的物理分片策略.其次,在各种分片基础之上,探讨了正则路径表达式RPE的并行查询处理问题,提出了两种并行查询处理方法:并行管道路径连接(PPPJ)查询处理方法和并行路径合并(PPM)查询处理方法.前者适用于基于节点模式的节点实例轮转法,后者适用于基于路径模式的路径实例均衡法和基于查询负载均衡的媒介节点分片方法.然后,特别针对RPE查询中比较复杂的结构化查询,如祖先-后代查询以及小树杈twig查询,提出了一种新的紧凑祖先树索引CAT来提高复杂结构化查询的查询效率.接下来,针对查询间的并行性给出了四种处理机分配调度策略,即平均分配法、比例分配法、组合分配法以及串行分配法,并分析了在不同处理机个数下它们各自所耗费的代价,以便使一个查询任务中的每个查询都能分配到最佳数目的处理机,从而使总的查询响应时间达到最小.最后,基于上述各种分片策略、并行查询机制以及各种索引等实现了一个并行XML数据库原型系统PXBASE,该系统对大规模XML文档实现了数据装载和数据划分,并能实现各种路径表达式查询.无论是查询条件的输入还是查询结果的输出,都可通过该系统提供的GUI与用户直接进行交互.
其他文献
智能优化算法近几年来广受关注,诸如“人工神经网络”、“混沌”、“遗传算法”,“禁忌搜索”等智能优化算法涉及到数学、物理学、生物学等各学科,为解决复杂问题提供了新的方法
互联网技术和信息技术的发展,使得企业之间的竞争越来越激烈,客户成为企业最为重要的资源之一,而客户关系管理正是一种以客户为中心的经营理念。 本文首先介绍了客户关系管理
流媒体是一种在Internet/Intranet中使用流式传输技术的连续时基媒体,如:音频、视频或多媒体文件.流式媒体在播放前不需要下载整个文件,只要将开始部分内容存入内存即可.流式
计算机支持的协同图形设计通过建立一个具有群体性、交互性、分布性和协作性的人机网络工作环境,来协助多个地理上分散的用户对一个大型的工程进行共同图形设计,它是CSCW的一
该文提出了一种基于Web Service的灵活的工作流管理系统e_ScopeWork的体系结构.这种体系结构是可以根据用户的需求而灵活变化的.此外该文讨论了面向大规模复杂应用的工作流管
P2P的结构由于代表网络中相互对等的节点能够相互传递信息,共享资源,充分利用peer节点的资源优势,同时具有相当大的灵活性(用户可以动态加入网络),最近几年锋芒毕露,在网络内
产品创新软件进化模块利用面向对象的软件开发技术实现了包括选择进化路线,进化模式,数据库检索,为用户快速、准确地定位解决问题的原理和实例,提供用户产品设计的最佳方案等功能
嵌入式Internet(Embedded Internet,EI)技术的不断发展与成熟,推动了人与设备、设备与设备之间的互联,实现了各类计算资源和各种设备的共享化,使得支持网络应用的嵌入式软件