基于Bloom Filter的路径表达式查询处理

来源 :复旦大学 | 被引量 : 0次 | 上传用户:skang08
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,XML语言已经成为了互联网上数据表示和交换事实上的标准。随着Web服务和个性化信息订阅等应用的蓬勃发展,越来越多的信息以XML的格式通过网络被发布和交换。在这些应用中,XML数据以数据流的形式不断地快速到达,而针对XML数据的查询是大量的路径表达式,传统的查询处理技术在性能上已经不能够满足应用的需求。在XML数据流上对大量的路径表达式进行查询处理是科研技术人员所面临的一个新的挑战。本文围绕XML数据流的查询处理问题展开研究工作,分别探讨了针对简单路径表达式和复杂路径表达式的查询处理技术,提出了新的处理方法,并通过实验验证了所提出方法的有效性和高效性。同时,本文就XML数据流处理引擎的设计进行了探讨,并实现了一个原型系统。论文的主要贡献可以总结为如下几点:·本文首先提出了将Bloom Filter结构应用于解决XML数据流过滤问题的方法,该方法可以有效地支持对简单路径表达式中的通配符“*”号和后代轴“//”的处理。同时本文设计了前缀过滤的方法,用于减少解析过程中所生成候选路径的数量,提高过滤处理的性能。详尽的对比实验表明,本文提出的方法在创建路由表时的性能和所创建路由表的大小两个方面明显优于已有的处理方法。同时,在查询集很大并且XML文档深度相对较小的情况下,本文提出的方法在过滤性能上也要优于已有的方法。·本文提出了将包含有分支结构的复杂路径表达式分解成一组简单路径表达式,在对简单路径表达式进行过滤处理的基础上,实现对复杂路径表达式进行查询处理的方法。与已有的方法不同,本文所提出的方法以简单路径过滤引擎输出的查询字符串流作为输入,可以支持对元素内容约束的处理,同时可以以连续查询(Continuous Queries)的方式实现对复杂路径表达式的查询处理。本文通过实验将所提出的处理方法与已有方法进行了对比,证明该方法在对复杂路径表达式的查询处理上具有较好的性能。·本文在简单路径表达式和复杂路径表达式查询处理技术的研究基础之上,设计和实现了一个XML数据流处理引擎——XSTR(XML STReamProcessing Engine)原型系统,并对该系统的实现进行了介绍。XSTR系统可以被作为中间件应用于针对XML数据流进行处理的应用系统中。综上所述,本文就XML数据流的查询处理技术进行了深入的探讨和研究,提出了不同于已有方法的新的技术和方法,并通过实验对所提方法的有效性进行了验证。本文的研究工作,促进了XML查询处理技术的发展,具有现实的应用价值。
其他文献
创新是国家发展的不竭动力。当前我国科技创新能力显著提升,但同国际先进水平相比依然有较大差距。如何加大企业创新投入成为我国跻身创新型国家前列和建成世界科技强国的一个关键。由于合理的资本结构能够为企业的创新提供长期有效的资金支撑,因此,资本结构成为影响企业创新投入的重要因素。同时,产品市场竞争作为企业最为重要的外部治理机制,能够降低信息不对称导致的委托代理问题,有助于企业做出正确的创新投资决策,引入产
<正>慢性心力衰竭(chronic heart failure,CHF)又称慢性充血性心力衰竭,是各种心血管疾病的终末阶段,严重威胁人类健康。西医主要采用强心、利尿及扩张血管等方法治疗,但效果
数据仓库是市场激烈竞争的产物,它将大量用于事务处理的数据库数据进行清理、抽取和转换,并按决策主题的需要重新进行组织,以达到有效决策支持的目标。自从它上世纪90年代初被提
西方音乐史学的兴起与发展经历了漫长的历史过程,其研究方法的讨论与纷争似乎也从未间断。其中,将民族音乐学的方法论用于西方音乐史学研究的探索与实践,不仅拓展了西方音乐
基于个性化服务的需求,用户需要根据网络环境和资源条件选择不同功能集的程序,由此产生了大规模分布式网络中按需定制计算问题。但是,在传统的Internet中缺乏一种自动根据客户需
  低温等离子刀是一种用于软组织手术的新技术,我科将它用于扁桃体的切除,具有手术时间短,术中出血少,术后疼痛轻等优点。总结我科从 2003年 6月至 2005年 2月诊断为慢性扁
目的探讨类固醇激素辅助小切口甲状腺手术显露喉返神经对保护喉返神经功能的临床价值。方法选择小切口手术治疗的甲状腺占位性疾病患者120例,随机分为干预组与对照组,各60例,其
程序挖掘是网络环境下实现按需定制服务的一种新型的网络计算模式。程序挖掘方法针对不同用户需求,从网络构件库中利用智能代理自动发现、组装应用与服务,通过灵活地选择构件组
在当今社会发展中企业要重视社会责任的部分,虽然我们一直在强调要以人为本,但是实际上这种管理理念在企业人力资源管理中并没有真正实行,企业的社会责任虽然分为内部责任和
“五年之内所有的公司都将成为英特网上的公司否则这些公司将不复存在”。英特尔总裁安迪·格鲁夫1999年曾这样说。 以往的工业社会中,商业规则十分简单—击败对手,压榨供应