面向通用计算GPU集群的任务自动分配系统

来源 :复旦大学 | 被引量 : 0次 | 上传用户：george_zg

【摘要】

：

面向通用计算的GPU具有超强的大规模数据并行计算能力,以及高吞吐量、高性价比等特点,而采用其作为加速设备的GPU集群则成为高性能计算领域的研究热点。由于GPU的加入,GPU集

【作者】

：

胡新明

【机构】

：

复旦大学

【出处】

：

复旦大学

【发表日期】

：

2013年期

【关键词】

：

GPU集群 MPI+CUDA编程模型数据流模型任务分配

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

面向通用计算的GPU具有超强的大规模数据并行计算能力,以及高吞吐量、高性价比等特点,而采用其作为加速设备的GPU集群则成为高性能计算领域的研究热点。由于GPU的加入,GPU集群呈现了多层次、复杂的的异构特征,使得应用程序开发、运行带来了很大的难度。当前对这一体系结构进行编程,是通过将传统的节点级通信模型MPI和具体的加速器设备编程模型(如CUDA)进行简单的松散耦合,形成的直观、可用的GPU集群编程模型(如MPI+CUDA)。在MPI+CUDA编程模型中,程序员需要手工的完成任务到节点的分配,这需要了解底层的体系结构细节信息。当集群规模较大时,采用手工的方式进行任务分配难度非常大。而且手工分配的结果和具体的底层集群体系结构高度相关,这也影响了程序的可移植性和可扩展性。此外,该模型按照任务控制逻辑对应用进行划分,这使之难以有效的挖掘应用中的数据并行性,并难以获得任务间的数据流依赖关系,因而难以实施有效地细粒度任务分配策略。基于MPI+CUDA编程模型存在的上述缺陷,本文引入了DISPAR数据流模型这样一种公认的适合于描述数据密集型应用的模型,并试图在这样一个新的编程模型下实施自动、优化的任务分配机制。DISPAR编程模型将数据密集型应用中的计算抽象为虚拟计算单元VNODE。 VNODE之间具有统一的、明确自定义的通信接口PIPE,因此任务之间的数据流依赖关系能够方便的获得。本文设计并实现了基于DISPAR编程模型的任务自动分配系统StreamMAP:(1)通过对DISPAR源程序中的任务资源需求和数据流通信关系进行分析获得整个集群应用的任务资源需求拓扑图,完成对集群任务的抽象表达。(2)提出了由“控制节点发出询问、各节点响应”这样一个获取集群当前资源分布信息(当前节点资源表)的方案,这样只需依赖一个普通的MPI程序就可动态获取集群的资源分布信息,不涉及任何操作系统层面的改造。通过这种较为简单的方式获得底层集群系统的资源模型。(3)在此基础上,提出并实现了一种兼顾高并行度、负载均衡、减少任务见通信代价等多个优化目标的任务分配算法。实验结果表明,通过streamMAP能够达到自动、优化地分配异构GPU集群任务的目标。本文对异构GPU集群任务调度的研究具有一定的指导意义。

其他文献

软件加密组件的分析、设计与实现

目前网络安全理论已经应用到现代计算机保密通信的各个领域，而且技术也日益成熟；基于组件技术的J2EE规范也发展地相当成熟，并且基于B/S架构的三层及多层体系结构应用系统也已经

学位

网络安全软件加密组件公开密钥密码体制数字签名算法

ITS虚拟共用信息平台安全解决方案

随着信息技术和网络技术的发展,越来越多的工程应用建立在公共网络的基础上,依靠计算机技术来实现。ITS(Intelligence Transport System)虚拟共用信息平台方案是一种建立在智

学位

ITS共用信息平台中央数据登记薄安全需求安全设计

基于多代理的工作流管理系统的研究与实现

目前工作流及工作流管理系统是CSCW领域研究的热点。本文以某设计院协同设计管理系统的建设为背景,研究了其中与工作流相关的技术问题。实现了一个基于多Agent的工作流管理系

学位

工作流工作流管理系统角色代理多代理协同设计工作流模式数字签名

小波变换在HPLC信号处理中的应用

小波变换是近年来发展起来的一门理论，在图像处理，通信和地球物理上取得了成功的应用。小波包变换是小波变换的推广。本论文围绕小波变换和小波包变换进行了理论和应用的研究。

学位

小波变换信号压缩重叠信号解析

一种基于RTS/CTS机制的自适应功率控制协议的研究

Power control is an efective way to enhance network throughput inlarge scale ad-hoc network, while the enhancement of throughput wouldcause more hops between so

学位

AdHocnetworkpowercontrolMACprotocolRT-S/CTS802.11

针对结构化商品数据的多样性搜索系统的设计与实现

近年来，网络购物越来越受到互联网用户的欢迎。在购物的过程中，用户使用关键字在商品搜索引擎中搜索需要的商品、商品附件、以及相关的商品。但现有的互联网搜索引擎给出的最相

学位

全文搜索多样性重排序电子商务

学习网格的构架、设计与实现

本论文首先分析了远程教育的发展现状,指出现行远程教育在资源共享(消除信息孤岛)、分布式、异构性等方面的不足,从而提出了建立学习网格的构想,并设计了学习网格的体系结构

学位

学习网格网格计算OGSAObject-Z

基于Web服务和消息机制的分布式工作流管理系统的研究与实现

工作流管理系统WfMS(Workflow Management System)是近年来随着Internet和Intranet的急剧推广而快速发展的软件系统之一。该系统的主要目标是通过调用有关信息资源与人力资源来协调业务流程中的各个环节,使之按照一定的顺序依次进行,从而实现业务流程的自动化。随着企业的全球化和IT技术的发展,现代企业信息系统的分布性、异构性和自治性的特征越来越显著,传统工作流

学位

XMLSOAPWSDLWeb Services工作流工作流管理系统分布式工作流管理系统信牌驱动式工作流模型

基于CORBA的网络管理系统的应用研究

一个有效的和健壮的网络一刻也离不开网络管理。传统网络管理方法简单实用,非常适合进行简单的网络管理任务操作。然而,随着网络应用的快速发展,网络规模不断扩大,网络复杂性

学位

网络管理分布式网络管理分布式对象SNMPCORBA

基于约束的序列模式挖掘方法研究

　　数据库中知识发现是当前涉及人工智能和数据库等学科的一个相当活跃的研究领域，序列模式的发现是其中的一个重要研究课题。本文重点研究了基于约束的序列模式挖掘方法

学位

序列模式单调约束强约束剪枝策略

面向通用计算GPU集群的任务自动分配系统

其他学术论文