【摘 要】
:
随着互联网的迅猛普及,网络在人们生活中所占的比重也越来越大,网络中出现大量与XML数据流有关的应用,比如网络日志、股票分析、互联网监控、数据安全管理、位置信息、电子信息
论文部分内容阅读
随着互联网的迅猛普及,网络在人们生活中所占的比重也越来越大,网络中出现大量与XML数据流有关的应用,比如网络日志、股票分析、互联网监控、数据安全管理、位置信息、电子信息查询等。以XML数据流为形式传输的数据有以下特点:数据量较大,而且不可预知;所有的数据都是在线到达,实时性高,并且无法确定其到达的顺序。显而易见,如果按照传统的数据管理方式进行处理将会非常困难而且浪费资源,因为传统的数据管理方式中的数据都是可以预知的,所有的数据都是预先存储的。近几年,研究人员已经提出很多种对于XML数据流的查询算法,如TurboXPath和StreamTX算法等。但TurboXPath已被证明在递归调用时存在潜在的隐患,StreamTX对于处理Parent-Child(PC)关系的查询时,会有很高的计算代价,在效率和灵活性上一直不能体现出令人满意的性能,所以设计一种更有效的查询算法成为了当务之急。针对以上问题,提出一种XML数据流小枝匹配算法TwigPM,在处理可能具有复杂的递归、层次结构的XML数据流时能通过获取查询节点的结构关系,进行有效的剪枝操作,节省了存储数据所占用的内存空间,避免了匹配的过程中可能产生的大量中间结果。算法功能分为两部分,第一部分得到查询树各节点的结构关系(包括父亲-孩子关系和祖先-后代关系),并将不同性质的节点进行分类;第二部分是剪枝和匹配过程。对于先后到达的元素事件,根据第一部分的节点分类对进行剪枝操作,移除一定不会存在于最终结果中的节点元素,并且在每个与查询根节点对应的End事件到达时进行匹配操作,得到匹配结果。根据提出的算法进行了性能测试,实验结果表明,TwigPM算法是高效的,尤其在处理存在父亲-孩子关系的查询时,能有效避免无关匹配,提高了查询效率。
其他文献
随着嵌入式技术的高速发展,软件开发的规模也日益扩大,其开发成本也随着软件开发的周期增长而越来越高。为了提高软件开发效率,只有在开发过程中采用创新的方法。为应对新的需求
基于无线通信的列车控制(Communication Based Train Control, CBTC)的列车自动监督(Automatic Train Supervision, ATS)系统主要实现对列车运行的监视与控制功能,通过ATS的
网络规模的飞速发展和宽带技术的广泛应用,使得互联网传输数据的流量以非常快的速度递增。大量的数据交换对互联网的核心设备一路由器的性能提出了越来越高的要求,尤其是要求
随着计算机技术与图形学的迅速发展,计算机动画已经被广泛应用到影视制作、游戏动画、广告、医学及教育等领域。运动捕获技术以其无可比拟的真实感和后期编辑技术的强大性成为
无线传感器网络作为21世纪具有重大影响力的技术之一,成为自动化技术研究领域的研究热点。工业无线传感器网络是在传统无线传感器网络基础上发展而来的,除了具备无线传感器网
在智能信息处理中,基于语义的词语相似度计算是一个非常基础而关键的问题,广泛应用于信息检索、机器翻译、自动问答系统、文本挖掘等领域。词语相似度计算的算法有很多种,大部分
当面对复杂多变的环境和陌生的任务时,即使是功能非常强大的计算机系统(如计算机网络、机群等),其表现也不能令人满意。一个重要的原因是,不同的任务要求系统具有不同的功能,
随着多年来虚拟化技术的不断发展,云计算逐渐普及,现代1T企业的工程师们不再满足于仅通过虚拟化技术来获取具有计算能力的虚拟机节点,而开始逐步将目光投向更加理想的应用开
近年来,随着我国车辆的增加,高速公路给人们带来许多方便,但同时也引发了许多新问题,超速,超载等违章现象以及汽车犯罪现象等加剧,伤亡事故不断发生。而且高速公路上一旦发生
随着游戏、仿真等图形技术的不断发展,以及工业设计、模拟仿真、三维影视等对三维复杂物体模型应用需求的不断增加,关于三维模型重建的相关研究越来越受到人们的重视。而由于