选择性估算的新算法研究

来源 :复旦大学 | 被引量 : 0次 | 上传用户:xndrz1985
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在数据库系统中,查询优化器是一个很重要的模块,它决定了一个查询的执行。而选择性估算算法在查询优化器中扮演着非常关键的角色。不正确的选择性估算结果可能导致查询优化器选择了差的查询执行计划,与最优的查询执行计划相比,一个差的执行计划往往需要花费几倍甚至几十倍的时间。本文主要研究基于直方图的选择性估算方法。直方图的构造是基于直方图的选择性估算方法中最基本的问题之一。构造直方图是基于某个目标函数的优化问题,即在给定数量的存储空间里,要求尽量准确地描述给定数据空间的数据分布。通常,这个目标函数要求:直方图模型和真实数据分布之间误差尽可能小,或者基于直方图模型进行查询估计的误差尽可能小。这里,不同的算法和应用对误差的定义可能有所不同。本文采用了一种新的误差概念,即聚合误差(AggregateError),来构造直方图。具体地,我们基于相对聚合误差(Relative Aggregate Error)来构造直方图,要求构造出来的直方图和真实数据分布之间的聚合误差最小化。我们通过对真实数据集和仿真数据集上的实验测试证实了本文方法的可行性。在较低维的情况下(维度≤4),用本文方法构建的直方图进行选择性估算的结果优于已有方法。另外,本文提出几种基于取样和直方图的混合选择性估算方法。基于直方图的选择性估算方法和基于取样的选择性估算方法都有各自的优缺点。对于低维度的数据,基于直方图的选择性估算方法有较好的准确率,优于取样的方法。但是对于高维度的数据,基于直方图的方法准确率直线下降,而取样方法的结果保持了很高的稳定性。因此,本文将基于直方图的方法和取样方法混合起来,期望在各个数据维度都有较高选择性估算准确率。在文中分别提出了基于相同取样率的混合方法,部分均匀取样的混合方法,与方差成比例取样的混合方法,查询优化取样的混合方法以及基于高斯分布描述的混合方法。通过大量的仿真实验证明,本文的混合方法大大减小了选择性估算的误差,并且有较好的数据维度适应性和可扩展性。
其他文献
随着WWW技术的广泛应用,传统的通用搜索引擎正面临巨大的挑战,存在着查全率不高、检索的精度不高、更新不及时、不能很好地表达用户需求,呈现给用户的搜索结果中包含大量与用
学位
“基于P2P的运营支撑系统的研究与设计”是项目课题“IPv6流媒体分发应用系统支撑系统的开发”的一个子课题。随着互联网的飞速发展,信息技术与信息产业日益受到重视。如何保
无线传感器网络集成了传感器、嵌入式计算、网络和无线通信四大技术,是一种全新的信息获取和处理技术,能够协作的实时监测、感知和采集各种环境或监测对象的信息,并对其进行处理
伴随着地图学、计算机科学、地理信息系统和传播学的发展,态势图正逐步从纸质化走向数字化、信息化。其应用范围也在不断扩大,如今态势图已经被广泛的用于灾害防范、资源勘测
无线传感器网络(WirelessSensorNetworks,WSN)能够通过各类传感器协作地实时监测、感知和采集各种环境或监测对象的信息,这些信息通过无线方式被发送,并以自组多跳的网络方式传
随着信息技术的飞速发展,尤其是计算机技术、网络通讯技术、安全技术以及自动化技术的日新月异,为群件系统的发展提供了广阔的空间。随着我国信息化建设进程的加快,无论是政府、
在3G通信时代,无线网络、无线接入、无线局域网一时之间成为网络界的新宠。石油勘探这一传统产业,主要依靠地质理论与技术人员的经验。在石油勘探领域开展无线局域网研究,在中国
随着Web服务技术及语义网技术的发展,网络中存在的Web服务日益增多。如何有效的定位到所需的Web服务将是该领域的研究热点与一大挑战。语义Web服务技术通过为Web服务提供语义
无线Mesh网络(WMN,Wireless Mesh Network,有称无线网状网或无线网格网)这个名词出现的时间并不是太长,大约在20世纪90年代中期以后,而真正引起人们关注只是在近两年。WMN的