【摘 要】
:
随着数据仓库应用范围的不断扩大,集中式数据仓库环境已不能满足用户的需求,分布式数据仓库技术应运而生。分布式数据仓库中的数据大多来源于多个分散、异构及自治的底层业务
【出 处】
:
沈阳航空工业学院 沈阳航空航天大学
论文部分内容阅读
随着数据仓库应用范围的不断扩大,集中式数据仓库环境已不能满足用户的需求,分布式数据仓库技术应运而生。分布式数据仓库中的数据大多来源于多个分散、异构及自治的底层业务数据库,其信息往往以实视图的形式分布存储在多个结点上,其中,预聚集数据是实视图的一个重要组成部分。预聚集数据的存在,加快了查询响应速度,大大提高了数据仓库的性能。然而,底层数据库中的数据是不断变化的,为使分布式数据仓库中的预聚集数据能够同步反映数据源的变化,必须对其进行及时维护。在介绍分布式数据仓库及预聚集数据相关知识的基础上,分析了脱机维护和联机维护存在的不足,扩展了动态增量维护算法的应用范围,提出了基于分布式数据仓库的动态增量维护的模型及算法,分别在各分布站点上设置两级视图,辅助实现视图的增量维护,取得了较好的效果。作为聚集数据的组织形式之一——数据立方体是二维表格的多维扩展。数据立方体的形成过程就是数据聚集的过程,对聚集数据的维护可以转化为对数据立方体的维护。在介绍多维结构及数据立方体的基础上,通过维划分引入维层次信息实现立方体的存储,同时对数据立方体进行分段划分,然后根据主题进行聚簇,提出了一种有利于分布式系统的数据立方体的存储结构——分布式数据立方体,使数据立方体据主题分布于分布式数据仓库的各个节点上,采用增量式维护算法及分布式并行处理的方法,对数据进行维护,提高了数据的维护效率。为了测试以往运用于集中式系统中的算法在分布式系统中的功能及效率,搭建了分布式系统模拟环境,以分布式数据立方体的形式对聚集数据进行了维护,运行结果表明,本文提出的技术在预聚集数据一致性的维护中能够获得较好的效果。
其他文献
医院多维分析与决策支持系统是指利用数据仓库和联机分析处理技术,实现对特定的业务进行分析和建模,并辅助管理人员制定决策方案的计算机应用系统。随着信息化技术的发展,数据库的数量和容量大得惊人,虽然医院拥有丰富的数据,但是却缺乏提取其中有用信息的工具和方案。医院多维分析与决策支持系统的研究和创建,能够充分利用大量的历史数据,将繁杂的数据转化为有利于医院管理人员的信息和知识,为提高医院的竞争力作出贡献。随
航天测控网资源分配和调度的目标是:在指定的调度时间段内,根据卫星测控任务需求,合理有效地分配各个测控站的资源,以解决日趋严重的“多星冲突”问题,实现完成任务的效益值
网络体系结构的改进和宽带技术的提高推动并加快了传统网络向下一代网络(NGN)的演进,用户对网络服务质量(QoS)的要求也越来越高。因此,如何提供端到端的QoS将是NGN的核心问题
随着信息科学技术和计算机科学的飞速发展,系统对存储、计算速度和带宽的要求也在不断的增加,单一的计算节点已经无法满足很多大规模计算密集型应用的需求,并行与分布式平台
汽车发动机是一个复杂的动力系统,其设备之间的复杂性导致汽车发动机故障诊断的复杂性和不确定性。由于这种不确定性的存在,使得难于建立一个定性的模型用于汽车发动机故障诊
本文以无线自组网中的入侵检测技术为研究重点,在总结当前该领域国内外的研究进展和无线自组网的安全现状的基础上,详细分析了入侵检测技术在无线自组网中遇到的挑战及现有技术
软件复用是提高软件生产效率和质量的现实可行的途径,其中基于构件的领域软件开发平台成为了研究的热点。零码软件生产平台是面向特定领域的基于构件的软件开发平台,提供了过
随着信息技术的发展,计算机已成为人们工作、学习和生活中不可缺少的部分,而计算机软件正是推动这一发展的主要动力。然而,盗版现象日益严重,引起了许多企业和学者的关注。要
随着互联网的普及和发展,网络已经与人们的生活息息相关。由于接入到互联网的人数激增,给传统的客户机/服务器模式的网络带来了很多新的挑战。近年来Peer-so-Peer(简称P2P)技
嵌入式系统SoC的器件尺寸越来越小、集成度越来越高、功能越来越复杂,传统的设计方法已经不能满足当前SoC设计的需求,因此出现了软硬件协同设计。软硬件划分是软硬件协同设计