【摘 要】
:
索引是数据仓库查询优化的重要技术,主要包括树形索引和位图索引。其中位图索引因为其结构简单,并且硬件支持二进制位运算效率很高,被广泛应用在数据仓库中。在属性的基数(该
论文部分内容阅读
索引是数据仓库查询优化的重要技术,主要包括树形索引和位图索引。其中位图索引因为其结构简单,并且硬件支持二进制位运算效率很高,被广泛应用在数据仓库中。在属性的基数(该属性可能的取值数)低的情况下,位图索引已经被证明是十分高效的。但在基数比较高的情况下,位图索引需要占用大量的存储空间。位图索引往往被认为只有在属性基数较低情况下才适合使用。为了克服这个难题,现今研究者们已经提出了很多方法,包括编码,压缩,bin。其中bin位图索引可以有效的降低高基数时位图占用的空间。这种索引不像简单位图索引那样建立在每一个不同的属性值上,而是建立在一个个的属性范围上。但它同时也带来了另一个难题,就是候选检查。候选检查往往占用大部分的查询时间。采用传统多维查询算法,对各属性进行查询的顺序不同,可能对总候选检查数目产生重大影响。本文给出两个定理,证明了影响排序的两个因素。并据此提出一种动态排序算法,通过在执行查询前对各属性查询进行排序,使总的候选检查的数目尽可能少。理论分析和实验表明,此排序算法可以明显减少总候选检查数目,优化了传统多维查询算法。但是动态排序算法并不能减少查询的第一维所需的候选检查数目,实验表明第一维所需的候选检查数目往往占总候选检查数目的大部。通过预扫描(推迟候选检查)可以有效解决这个问题,但是进行预扫描需要额外的花费,即要扫描更多的索引,这个代价是不能忽视的。考虑到预扫描一定维数后,继续预扫描将不会明显的减少总的候选检查数目,本文在排序的基础上提出动态预扫描算法,目标是在预扫描属性数目和总的候选检查数目中找出一个合理的平衡点,以提高查询效率。理论分析和实验结果表明,动态预扫描算法取得了良好的效果。
其他文献
对于可穿戴计算技术(Wearable Computing)来说,它诞生在计算机软硬件技术的飞速发展以及基于嵌入式系统的电子产品在人们日常生活中的广泛应用的背景下。它是一种新型的可以应用
高压输电线路是大容量、远距离送电的主要方式,因此,在发生故障时进行准确的定位,快速的排除故障对电力系统的安全运行具有重大意义。目前,由于行波法具有稳定性好、定位精度
随着高校扩招,班级人数不断增加,而教师人数相对没有增加,这样就导致教师由原来的小班授课变为大班授课,班级人数也由以前的几十人增加到上百人。这样的教学模式在一定程度上
随着信息化时代的到来,我们的生产和生活中信息传递越来越重要。在工业控制领域,测控网络的高可靠性,低功耗,低成本成为技术发展的主要目标。于是IEEE委员会发布了802.15.4标
为了提高服务发现的效率,UDDI 2.0中增加了标识系统和第三方分类系统。但是,由于这种分类系统局限性较大,仍然难以实现精确的查找。传统服务发现模型当中,服务描述完全由服务
随着现代科技的逐渐发展,科技、军工、医药以及生活中的各个方面都在要求计算机性能的提升。传统的依靠提高处理器的主频来提升计算机性能的方式已经达到了极限,而且电子制作
本课题依托于北京市教育委员会科技计划面上项目-满足政务业务流重组需求的相关技术研究。
随着信息技术的飞速发展,电子政府/电子政务在全球范围内受到越来越多的重视。
随着计算机技术的不断发展,网络资源变得纷繁冗杂,人们对于资源共享的需求也越来越专业,如何在海量的信息中找到自己所需的资源成了亟待解决的问题。作为网络技术的提升和发
随着无线通信技术的飞速发展,频谱资源的分配日益紧张,使得新兴无线设备无法获得授权频谱。另一方面,来自联邦通信委员会频谱策略任务组的研究报告表明:在绝大部分时间,授权频谱的
我国水资源虽然总量比较丰富,但是由于人口众多,人均水资源占有量却很低。同时,由于水资源在时间和空间上分布的不均匀,导致季节性和地域性的水资源紧张。随着社会、经济的发展,有