【摘 要】
:
并行数据库通过将一个关系中的元组分割放置在多个节点的磁盘上,利用I/O并行性,来获得较高的性能.如何对数据进行划分和放置就是所谓的数据放置(Data Placement)问题.数据放
论文部分内容阅读
并行数据库通过将一个关系中的元组分割放置在多个节点的磁盘上,利用I/O并行性,来获得较高的性能.如何对数据进行划分和放置就是所谓的数据放置(Data Placement)问题.数据放置策略的优劣直接影响着系统的整体性能和可伸缩性(Scalability).而且,数据放置对于无共享(SN)结构并行数据库本身就是一种重要的负载平衡机制.因此数据放置策略在并行数据库系统中具有相当重要的位置.课题是通过开发一个支持数据并行处理的中间件,将机群并行计算机各节点上的单机版数据库联系起来,构成并行数据库中间件系统.系统中各节点并行工作,获得接近并行数据库的性能.机群并行计算机是一种无共享(SN)结构的并行计算机,因此这里的数据放置技术实质上就是SN结构并行数据库的数据放置技术.数据放置的方法与策略是因地而异的,不同的系统需要不同的策略.该文的主要工作就是研究实现适合该系统的数据放置算法与策略.论文对并行数据库数据放置技术进行了全面的研究,提出了适合该系统的改进的Hash划分方法—IH划分法;实现了数据重划分的静态和动态算法;确定了采用基于容量的数据放置策略;并对自动数据划分进行了初步尝试,建立了一个基于DB2查询优化程序的自动划分工具,减轻了数据库管理员的负担.论文中还对无共享(SN)结构并行数据库系统的数据倾斜、数据复制、"小表"的处理、索引的放置等数据放置相关问题进行了探讨,提出了该系统中相应的解决办法,并实现了索引的并行放置.目前中间件领域技术已成熟,采用中间件来实现多层架构的并行数据库系统是对当前并行数据库技术领域的发展.
其他文献
远程教育作为现代教育技术的形式,有效地牵引着教育资源的优化,给教育思想与技术带来了革命性的变革,已经成为现代教育的必然要求.远程教育要得以顺利、高效的实施,必然离不
本文的工作主要是进行数据相关性测试的研究,作者首先回顾了数据相关性研究的传统方法,以及并行编程与数据相关性的关系。进而提出了基于路径分析和符号执行的静态测试和动态测
基于认识模型的多信息融合方法是模仿人类从其多传感器例如耳、眼、手等数据辩识实体的识别过程模型,该文是以工业链条炉为控制对象,提出采用专家控制系统对多传感器的信息进
将虚拟化技术应用在高性能计算领域是当前高性能计算研究的一个热点,但对于小规模高性能计算来说,由于自身硬件资源异构、追求峰值计算速度等特点,因此对虚拟化技术有着自己
在当今网络环境中,为了提高工作效率同时规范流程管理,处理定时任务的应用需求不断涌现,这些定时任务的特性就是有规律的重复执行,如果人为完成,非常困难也不安全。而定时调度就是
成像光谱是对地观测最前沿的技术之一,其应用十分广泛,机载成像光谱数据处理技术服务系统是一个为了提高数据处理、数据产品生成、规范化数据管理和分发效率的综合服务系统.
不确定信息处理是人工智能领域一个重要研究方向,从专家系统角度来看,大致有基于规则和基于模型两种不确定性信息处理方式。Bayesian网研究兴起于20世纪80年代,20世纪90年代以来
企业一级的计算机应用系统通常规模庞大,结构复杂。现阶段的企业开发,一般依赖于N层面向对象的平台,例如J2EE和.Net。这些平台都基于分布式网络环境,虽然能够有效地促进企业应用,
Internet是一个巨大、复杂、开放的网络集合,随着其重要性的日益提高,越来越有必要对网络整体拓扑结构进行深入地了解和分析,这对于保证和提高现有网络服务质量、推动互联网
对象代理模型(object deputy model)是一种新型的数据库模型,它引入了对象和代理对象这两个基本概念,并用对象和代理对象一起来模拟现实世界中的实体.代理类对源类的继承是一