【摘 要】
:
随着网络应用的快速发展,XML已经成为网络数据存储和交换的事实标准,越来越多的信息处理系统采用XML文档作为信息存储、交换和发布的载体。如何有效管理XML数据一直以来都是
论文部分内容阅读
随着网络应用的快速发展,XML已经成为网络数据存储和交换的事实标准,越来越多的信息处理系统采用XML文档作为信息存储、交换和发布的载体。如何有效管理XML数据一直以来都是研究界关注的热点,其中的关键问题之一是设计支持XML数据更新和支持高效查询处理的编码方案。本文针对已有编码方案要么支持高效查询但不支持更新,要么支持更新但不支持高效查询的问题进行了深入的研究,主要研究内容如下。首先,针对扩展Dewey(ED)编码支持高效查询处理但不支持更新操作的问题,提出一种基于动态有限状态转换器(DFST)的动态扩展Dewey编码(DED)。DED编码既支持编码自身的更新操作,又可以避免当文档DTD(文档类型定义)发生变化时已有编码失效的问题,能够完整的支持XML数据的更新操作。进而,针对已有编码方案存储空间消耗过高的问题,提出一种基于霍夫曼编码的改进存储方案,减少编码存储的空间消耗。其次,针对扩展Dewey编码解析途径单一的问题,提出一种基于可逆有限状态转换器(RFST)的查询匹配算法EDTS。RFST通过代价模型选择编码解析策略,支持双向编码解析,提高编码的解析效率和查询处理的整体性能。最后,通过实验对DED编码的有效性和EDTS算法的高效性进行了验证。
其他文献
软件复用是解决软件危机、实现软件产业工业化生产方式的有效途径。软件复用活动包含两个相关的阶段:可复用软件资产的生产阶段和基于可复用软件资产的应用系统开发阶段。领域
项目管理信息化是一个信息技术和管理科学相交融的研究领域。管理科学是项目管理信息化的灵魂所在,任何一个优秀的项目管理系统都蕴含着科学的管理理念;同时,信息技术也是支撑项
网络所包含的庞大数据量为人们提供了丰富的知识,却使用户迷失在信息的浩瀚海洋中,形成了诸如“信息过载”和“资源迷航”等日益严重的问题。为了帮助用户有效地利用网上资源,产
生物特征是标识和鉴别个人用户的天然凭证。每个人的生物特征都具有与他人不同的唯一性和在一定时间内基本不变的稳定性、无需记忆、无需存储、难以伪造和假冒,可给用户带来更
购物中心是众多店铺的聚集地,并通过店铺为消费者提供丰富的商品、综合的服务、优雅的环境等。购物中心管理者越来越强调高价值店铺对购物中心运营成功的重要贡献,因此如何充分
期权作为最基础的金融衍生产品之一,为其定价一直是金融工程的重要研究领域,主要使用的定价方法有偏微分方程法、鞅方法和数值方法。1973年由Black和Scholes提出的Black-Schole
随着JEE应用服务器的迅速发展和广泛应用,应用服务器的功能越来越丰富,应用服务器平台化的趋势越来越明显,它要求应用服务器具备良好的可伸缩性、模块的可移植性、以及运行时的
密码学是解决信息安全问题的核心技术,数字签名作为密码学的关键技术,在信息认证方面发挥着重要作用。可验证加密签名是特殊的数字签名体制,能够实现普通数字签名无法解决的
传统的文本检索模型大都以词项独立性假设为前提,即认为同一个词项的多次出现独立、不同词项之间的出现也独立。词项独立性假设不仅简化了理论模型上的推导,而且在实践中也获得
随着业务流程管理的不断发展,以数据为中心的业务流程管理成为一种新的趋势,典型代表是IBM提出的用Artifact来作为业务流程中的核心数据的思想。ArtiFlow是一种以Artifact为