支持XML数据更新的编码方案与索引技术研究

来源 :湖南师范大学 | 被引量 : 0次 | 上传用户:niudaben
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
XML已经成为Internet上数据表示和数据交换的标准格式。近年来,在Web上涌现了大量的XML数据。为了更容易的操作XML文档中的数据,专家和学者们在编码、索引、查询等方面做了积极深入的研究,已经提出了大量的编码方案和索引技术,但当XML数据需要频繁的更新时,由于这些编码方案和索引技术都不支持XML数据的动态更新,需花很大的代价去重新编码和建立索引,严重影响了它们的效率。为此,本文在支持XML数据动态更新的编码方案和索引技术方面进行了有益的探索。本文深入分析了XML文档的结点编码技术,提出了一种支持XML数据动态更新的结点编码方案CSSU。CSSU编码采用字母、数字和下划线对结点进行编码,改变了传统编码方案主要采用数字序号进行编号的特点。由于插入和删除结点,不影响其他结点的编码,完全不需要重新编码。CSSU编码在任意两编码之间存在无穷大的编码空间,不会出现LI-MOON编码那样通过预留编码空间的方式存在编码空间会用完和预留空间大小不容易确定的问题。所以当XML数据需要频繁的更新时,可以成倍地提高结点编码的效率。以CSSU编码为基础,本文提出了一种新的支持XML数据动态更新的索引DUIX。DUIX索引可以快速确定任意两结点间的结构关系,同时保存了孩子—双亲元素的详细信息,并把相同标签路径的结点聚簇在一起。DUIX索引支持分支查询,不再依赖XML文档,访问一条路径可得到该标签路径下的所有结点,跳过了大量不相关的结点。与其他索引技术相比DUIX索引的效率更高。最后,本文对CSSU编码和DUIX索引与基于Ctree的索引和XISS索引做了大量的对比性实验。结果表明,CSSU编码和DUIX索引是有效的。
其他文献
随着网络多媒体技术的快速发展,互联网上的图像等多媒体内容的数量正在以指数级的速度迅猛增长。因此,实现大规模互联网图像的有效管理和检索具有十分重要的现实意义。由于大
入侵检测系统是网络安全一个重要组成部分,可以较好地弥补传统的防火墙技术不能解决的问题。生物免疫系统与入侵检测系统有着许多相似之处,比如分布式保护、多样性、自适应性
无线传感器网络具有能量有限、通信能力有限、多跳路由、动态拓扑、节点数量众多且分布密集等特点。同时,无线传感器网络的还面临着一些分布式优化问题。如,任务动态部署、节
随着计算机技术和互联网的快速发展,社交网络、智能设备、传感器设备、云计算中心实时生成大量的信息数据,如何从中提取有价值的知识已成为一个巨大的挑战。形式概念分析由德
大数据正在成为继云计算、物联网、移动互联网之后新的信息革命高潮。无论是从数据传递及共享、数据存储,还是从数据检索及分析,信息技术正面临前所未有的挑战。信息表示和查询
软件测试是为了保证软件的正确运行而进行的一项重要活动,回归测试是软件修改后为了确认修改的正确性而进行的软件测试。回归测试策略分为重测所有(retest-all)和选择性(selec
随着WWW的迅速发展和普及,人们已经从信息资源匮乏的时代迅速过渡到信息极为丰富的数字化时代。面对网上海量的信息资源,人们很难迅速有效的找到真正所需的信息。因此,如何合
数字图像每天都以惊人的速度产生和发布。图像中含有的信息往往比文本更加丰富,在人们的日常生活中起着至关重要的作用。因此,如何更加有效的组织、管理大型图像数据库,并且能从
处于大数据时代下,网络信息出现迅猛增长的趋势,互联网日趋发展成为一个信息覆盖面广的共享仓库,与此同时,对信息资源进行准确地理解也变得越来越困难,这是信息时代中一个亟
物联网感知层是物联网末端的一项全新的有着特殊意义的技术,也是它的核心部分。常见的物联网感知层常见形式有传统条码、二维码标签和无线射频识别技术,其中无线射频识别技术