数据立方体预计算算法在财务数据仓库中的研究与应用

来源 :北京大学 | 被引量 : 0次 | 上传用户:einsun222
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据库系统的发展和大规模综合决策分析的需求越来越迫切,数据仓库系统应运而生。数据仓库通常基于多维数据模型,各个维度的数据以及不同层次的汇总数据构成了数据立方体,数据仓库对联机分析处理的加速原理正是数据立方体的预计算,也即称为物化的过程。因此数据立方体预计算算法优劣直接影响到数据仓库的性能。   财务数据仓库是一种典型的高维数据仓库,而其本身的特性决定了在财务数据仓库中用户需要精确的信息。财务数据仓库的这些特点限制了财务数据仓库中数据立方体预计算算法的选择范围。   当前流行的数据立方体预计算算法主要有完全立方体、冰山立方体、立方体外壳和立方体外壳片段等。本文首先介绍了这些数据立方体预计算算法的特点,然后以北京大学现有的异构财务数据库为基础设计了财务数据仓库的事实星座形模型,并设计和实现了财务数据仓库的一个子集科研财务数据仓库。在科研财务数据仓库中,本文分别使用了各种数据立方体预计算算法进行物化操作,并根据财务数据仓库的特点提出了立方体外壳片段算法的一个改进版本,在这个改进版本中,使用不等长、可相交的外壳片段代替等长、不相交的外壳片段,以提高财务数据仓库在频繁查询集上的处理效率。同时本文还扩展了可处理的OLAP查询种类,使得财务数据仓库能够处理包含确定值、范围值和列表值的各种查询,从而可以涵盖用户的各种联机分析处理需求。   最后,本文通过对预计算时间、存储空间和低维OLAP查询处理效率、均匀的高维OLAP查询处理效率以及有偏的高维OLAP查询处理效率等方面的性能分析,证明了本文提出的立方体外壳片段算法的改进版本能够在各个方面取得较好的平衡,比较适合于财务数据仓库。
其他文献
问答系统是集自然语言处理技术和信息检索技术于一身的新一代智能搜索引擎。与传统的搜索引擎相比,问答系统能更好的满足用户的查询要求,更准确地检索出用户所需要的答案。问答
基因可变剪切计算是生物信息学领域一种重要的科学计算应用。单个基因可变剪切计算批作业中包含大量串行子任务,需要大规模的计算处理能力。这些子任务可以在网格计算环境中并
网页是一种易逝的信息资源,在新网页不断涌现的同时旧网页也在逐步消失。如果没有专门的机构来对网页进行收集和保存,它们就会在不经意之间消失。而随着互联网成为一种不可忽视
近年来,国内外学者对数据流上的聚类分析问题进行了大量的研究工作,但仍存在不少问题尚待研究和解决。大多数基于网格的聚类算法,对网格单元缺乏有效的存储结构;现有算法对簇
随着Web服务技术的发展,出现了在Web服务的基础上进行组装以实现增值服务的需求,服务流程的概念随之产生,并在业务流程管理、工作流技术等中得到了广泛应用。服务流程中不可避免
现在人们日常生活中所使用的计算机设备已不仅仅只局限于一台个人电脑,而是包括个人电脑、笔记本、掌上电脑和智能手机等多种设备。用户在与这多种设备的日常交互中,会积累下很
图像分割是数字图像处理领域的重要研究内容。随着数字图像处理技术的发展和相关学科的进步,图像分割在图像编辑、计算机视觉、医疗影像、遥感图像等方面都取得了良好的应用,而
目前,国内伺服系统主要是通过伺服驱动器的控制面板进行调试。采用这种调试方式,工程人员不易观察机床的运行状态,并且恶劣的现场环境容易造成控制面板按键的失效,从而给伺服系统的调试带来了诸多不便。本文在这种需求和背景下,采用软硬件协同设计思想设计并实现了一个方便、灵活且低成本的伺服手持终端。该终端以C8051F单片机作为处理器;以数码管作为显示器;通过键盘控制伺服运行参数的选择和发送;通过串行口与伺服系
卫星星座是指由多颗卫星按一定形状构成的可提供一定覆盖性能的系统,可以通过多星协作来完成通讯、气象、导航、定位、侦察、预警、监视等各方面的任务。作为卫星星座的重要性
签密在系统只需要提供保密性或认证性时,必须切换到其他的加密或者签名算法才能满足需要,从而增加了额外开销。广义签密解决了这个问题。基于身份的广义签密在要求同时满足保