动态XML编码研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:bingyuziqi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于不断增长的网络应用需求,以及在通过网络进行交互时的可靠性与互操作性需求,XML已经成为Internet上信息表示和交换的事实标准,支持XML动态更新已经成为现实应用中越来越重要的需求。设计出XML动态编码来支持文档动态更新,是使XML真正成为Internet上信息表示和交换标准的关键。由于之前学术界对XML的研究主要集中在XML文档查询方面,因此.XML更新领域还存在很多问题,包括不能完全避免重编码、无法兼顾查询效率、及编码存储代价太大等。 针对这些问题,本文首先介绍了XML及其研究现状,包括XML文档模型、XML文档查询、XML存储策略和XML索引技术。然后重点介绍了XML编码,分析了目前XML编码在XML更新中存在的问题,提出了动态xML编码的衡量标准。 针对Dewey编码在XML更新中重编码计算量大的问题,在定义儿子名字索引基础上,本文提出了扩展Dewey编码。扩展Dewey编码包括局部扩展Dewey编码、基于最大值的局部扩展Deweyr编码和全局扩展Dewey编码,它有效地减少了XML更新中重新编码的计算量,提高了更新效率;设计了回指树的数据结构,并基于回指树,提出了xML文档中单个节点的插入和删除算法。对于现有的Dewey编码,本文作了充分全面的实验,用于验证结果并比较其性能。 扩展Dewey编码只能在一定程度上减小重编码,不是真正意义上动态编码。为此,本文提出了能够完全避免XML文档更新中重编码的CDOEX编码。在任意两个相邻的CDOEX编码之间插入无限多个新的编码,不会引起已有编码的重编码,而且保持了这些编码的字典顺序。同其它能够完全避免重编码的动态编码相比,CDOEX编码在XML频繁更新、尤其是倾斜频繁更新时,编码大小增长较慢,这不仅仅提高了存储效率,也避免了查询效率的降低。实验证明,CDEX编码是目前存储代价最小的能够完全避免重编码的XML动态编码之一。
其他文献
随着企业对工作效率要求的提高,工作流的应用越来越广泛,对工作流的研究也正向更深层次进行。工作流主要分为两部分:工作流模型的创建和工作流的执行。目前工作流建模工具界面
随着社会的日益信息化,人们越来越强烈地希望用自然语言同计算机交流。自然语言理解是计算机科学中的一个引人入胜的、富有挑战性的课题。从计算机科学特别是从人工智能的观点
受天气预报技术的制约,目前国内市场尚无法提供高精细化的气象信息,在一定程度上影响了我国气象经济的总体规模,但是我国幅员辽阔,容易遭受各种极端天气的危害,相关行业急需不同领
嵌入式系统是以应用为中心,以计算机技术为基础,并且软硬件均可裁剪,适用于应用系统对功能、可靠性、成本、体积、功耗有严格要求的专用计算机系统。在嵌入式系统需求不断增长的
词的分类问题是语言学和自然语言处理中十分重要的研究问题。由一些语义相近的词组成的词类(或词聚簇)可以看成是纷繁的个别词现象到语言的一般概念的映射,而这些概念是更加本
随着电子技术和嵌入式技术的发展,音频数码产品的功能日益强大。从原始的卡带随身听到音乐发烧友挚爱的CD walkman,再到如今人手必备的MP3,MP4,嵌入式音频设备可谓经历了一次历史
目标跟踪是计算机视觉中一个具有挑战性的任务。近些年来,随着深度学习技术的发展,基于单次深度学习的目标跟踪算法受到了人们的广泛关注。基于单次学习的目标跟踪方法指的是
产品质量是钢铁企业的生存之本。企业要想在如今激烈的市场竞争中占据有利位置,首先必须做到“知己”,即对自己产品质量的优缺点有准确的了解。准确了解产品质量,必须建立在对产
目前,WWW已经发展成为包含多种信息资源、站点遍布全球的巨大信息服务网络,是最丰富和最密集的信息来源。与此同时,纷繁复杂的信息资源的组织和显示方式也各不相同,使得用户在浏
随着高速公路联网收费系统在全国的普遍实施,利用电子不停车收费技术提升高速公路通行能力,提高服务品质的需求也日益凸显。2004年8月,交通部正式批准“联网电子收费工作组”,负