XML索引技术的研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:aweids
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来随着互联网的高速发展,人们进入海量的信息时代, XML以其强大的数据表达能力以及简单、开放性、可扩展等优点而逐渐成为互联网上信息发布和数据交换的标准。但随着XML的广泛应用,XML数据急剧增多给XML文档的维护工作带来了很大的挑战,为了更好地对XML文档进行维护,使得其他应用程序更容易对XML文档进行操作,人们从存储到索引、再到查询做了积极深入地研究。这些研究促进了XML的发展,解决了现实中的诸多问题,许多优秀的研究成果已经有了一定规模的应用如Lorel[1]。但是由于XML数据的多样性以及用户日益增长的查询需求,人们很难找到一种能同时适应不同的数据来源(XML纯文本,关系型数据库以及其他各种应用数据等)并能够有效的处理各种查询请求的通用索引结构。因此,针对不同的XML应用,人们提出了不同的索引结构,来满足不同环境下的需求。目前对XML索引研究集中在基于节点记录类和结构摘要类两类索引方法,但它们普遍存在索引对内存要求较高、索引更新效率低等问题,特别是对非常常见的Twig结构查询处理时,都需要进行大量的联接而影响到查询的性能。本文基于上述的缺点提出两种索引技术MTB-Index和MIF-Index,这两个索引的创新之处体现在以下几方面:1. MTB-Index索引支持索引的动态更新2. MTB-Index索引采用线性模型,它把查询路径匹配转换为区间的匹配3. MTB-Index索引能够有效处理带有“//”结构的查询4. MIF-Index索引占用空间小,可以直接放在内存从而提高查询时间5. MIF-Index索引处理Twig结构无需进行连接,避免了以往索引处理Twig结构都要进行连接的弊病
其他文献
近年来,移动AdHoc网络以其无需任何基础设施支持即可快速组网实现便捷通信的优异特性,已经获得各个领域的广泛关注。然而,由于其本身固有的介质开放、拓扑结构高速动态、缺乏集
嵌入式系统是由软件模块和硬件模块组成,用来完成特定任务的专用系统。 随着嵌入式系统复杂程度不断提高,特别是集成电路设计进入SOC开发时代之后,传统开发方法已难以适应系
BOSS是业务运营支撑系统(Business&OperationSupportingSystem)的简称,是运营商赖以生存的关键系统。计费系统是BOSS的核心子系统,它的性能是运营商管理水平体现的关键。计费过
新世纪以来,越来越多的科学和工程计算需要高性能计算,于是在传统的分布式计算技术上发展了元计算、正统的网格计算和对等计算等相关领域技术。网格环境下的资源分配与调度是一
随着计算机网络技术和通信技术的飞速发展,全球信息化已经成为不可阻挡的趋势。越来越多的企业和组织建立了与自己的关键业务相关的计算机网络系统,借以提高工作效率、降低成本
CAD系统的可扩充性与后续开发的延续性一直是困扰国内CAD产业发展的瓶颈。设计出具有良好的集成性,开放性和高效率的软件体系结构也是现阶段国际软件行业中研究的热点。因此,对
动态电源管理主要是为了在满足用户需求时动态调整系统资源状态,达到系统节能的效果。对于电池供电的嵌入式系统而言,延长电池的供电时间非常重要,DPM系统为我们延长电池使用
移动AdHoc网络(MobileAdhocNETworks,MANET)是一组具有路由功能的移动节点组成的分布式无线多跳网络,不依赖于任何预设的基础设施。MANET网络具有网络拓扑动态变化、无线传输带
当前,随着Web2.0概念的提出,AjaX技术作为富互联网应用程序(RichInternetApplications,RIA)实现技术中的一种,已成为web技术领域的研究热点。并且这股研究热浪在google推出google
变化是软件开发所面临的永恒主题,软件需求的变化给软件开发提出了很大的挑战。为了满足这种变化的需要,必然要设计一种能够和企业业务同步发展的软件体系结构。该体系结构应