基于GPU的高性能并行算法研究

被引量 : 0次 | 上传用户:cyc198810
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机图形处理器(Graphics Processing Unit,GPU)的高速发展,不但促进了图像处理、虚拟现实、计算机仿真等应用领域的快速发展,同时也为人们利用GPU进行图形处理以外的通用计算提供了良好的运行平台。基于GPU的图形处理及其通用计算成为图形学及高性能计算领域的热点研究课题。基于GPU的高性能并行算法研究是该课题的重要内容之一。本文以探索GPU大规模并行通用计算的运用模式为目标,从传统问题入手,选择典型算法进行研究,主要研究了数值类算法中的非计算密集型算法、数据密集类算法和元启发式优化算法这三类算法在GPU上的并行化。数值类算法中的非计算密集型算法存在内存墙问题,而在基于GPU的并行化过程中,该瓶颈尤为突出。本文以稀疏矩阵向量乘算法为代表,研究基于GPU并行化方法以及性能优化策略。数据密集类算法由于其特有的数据可分割性,因而比较适于GPU并行计算。本文以频繁模式挖掘算法和最近邻搜索算法为代表,研究了此类算法的GPU并行化方法以及性能优化策略;针对最近邻搜索问题,结合KD-Tree空间划分与ABT方法,提出了适于欧几里德距离的点剪枝策略。元启发式优化算法是求解大规模优化问题的高效方法之一,其解空间搜索过程具有天然的并行性。本文以蚁群算法为代表,研究了蚁群算法及其若干改进算法在GPU上的并行化方法;针对蚂蚁个体智能性不足的问题,提出了带有展望策略的蚁群优化算法;针对蚁群参数敏感问题,研究了多蚁群在GPU上同时进化方法,提出了适于GPU的粗/细粒度结合的多蚁群算法;针对异构多蚁群的信息交流问题,提出了一种新的基于共享信息素矩阵的交流策略。大量的标准测试表明,上述算法可以达到几倍甚至上百倍的加速比;与已有的同类基于GPU的并行算法相比,上述算法具有更高的实际浮点性能和存储器带宽。CPU+GPU的异构多核架构是目前GPU大规模并行通用计算的运用模式,探讨传统算法的GPU并行化方法,使之更适用于异构多核架构下并行计算,能够为基于GPU的高性能计算的普及提供理论和方法。
其他文献
随着新兴技术的快速发展,智能船舶逐渐成为船舶工业发展热点。本文介绍了智能船舶技术分类,梳理现阶段国内外智能船舶技术发展现状,研究国外智能船舶技术发展特点,分析我国智
化学教育是素质教育的一部分。在化学教学过程中运用工程思维教学,是培养学生实践能力的重要手段。本文分析了工程思维的内涵及特征,总结了化学学科的特点以及工程思维在各个
利用线上线下问卷调查数据,从消费者的性别、年龄、地域、学历、职业、收入等方面分析了丝绸消费者的个体特征,从购买用途、产品种类、替代品、购买或不购买的原因、消费水平
目的 :评估健脾调肝饮对单纯性肥胖患者减重效果及对血清nesfatin-1的影响。方法 :将符合纳入标准的60例患者随机分为两组,治疗组应用健脾调肝饮治疗,对照组应用盐酸二甲双胍
期货市场的发展和制度的完善离不开理论研究的指导作用,处于制度创新阶段的中国期货市场,理论研究显得尤为重要和紧迫。从理论上说清楚中国期货市场发展存在的问题,提出解决
本文以中国家庭金融调查微观数据(CHFS)为支撑,研究家庭成员身体状况对居民健康消费的影响。本文将健康消费进一步划分主动健康消费与被动健康消费,并引入安全意识因素。基于
根据课程改革需要和Blackboard网络平台的特点,设计并构建基于Blackboard网络平台的协作学习教学模式,将其应用于医学信息检索课教学,并对教学效果进行评价。实践结果表明,基于Bl
在进入到21世纪以后,我国在医疗发展方面也迈上了新纪元,而科学技术的发展更是为当代医疗事业的进一步发展创造了有力条件,各种先进的医疗诊断技术不断出现。目前,远程医疗已
随着我国社会与经济的进步,各行业发展迅速,城市轨道交通也飞速发展,城市轨道交通线网中换乘站越来越多,换乘方式设计的进一步研究势在必行。就当前我国地铁车站换乘方面的现
虚拟网络映射忽略通信路径上中间节点的资源消耗,以底层物理网络资源消耗最小或路径最短为目标,导致最优路径上中间节点资源不足而出现瓶颈,影响整个底层网络的性能及后续虚