论文部分内容阅读
随着计算机性能的飞速发展,人们渴望能够更加精确的模拟等离子体的特性。为此全三维相对论的粒子模拟逐渐被提出来,引入的宏粒子数目达到106~1010个,这使得PIC模拟消耗的计算机资源(包括计算机内存以及计算时间)呈数量级的增长,为了解决庞大的计算负担,开发相应的并行PIC模拟算法非常重要。并行PIC模拟的很多成熟算法都基于传统体系结构的中央处理器(CPU),但是CPU的有限资源成为计算瓶颈。过去的十年里,一种新的大规模并行处理器——GPU(Graphic Processing Unit,图形处理器)开始被应用到科学计算领域。本文第一章介绍了等离子体粒子模拟的发展概况以及在计算中所面临的问题。GPU的发展历程和应用于并行计算的发展概况。本文第二章介绍了一种将GPU视作数据并行计算设备的软硬件体系——CUDA统一计算设备架构。详细的描述了在分析问题的过程中对计算任务进行粗粒度和细粒度的方法,以及CUDA模型中大规模的并行线程在GPU硬件中的映射方法、调度执行方式。本文第三章以模拟多环形电子注在圆柱系统中的运动轨迹为例介绍了等离子体的粒子模拟方法。其中理论分析包括:电子运动方程的求解、电荷源的求解以及Poisson方程的求解三个部分。由于电子注的环形特征以及圆柱系统的轴对称性,采用圆柱坐标系及该坐标系下的网格划分来进行理论分析和数值模拟。本文第四章结合第二、三章的介绍,分析了PIC模拟在GPU上的可行性,提出了总体的实现流程。把整个计算分为了带电粒子运动求解,网格点电势更新,电荷密度求解,其中将电荷密度算法修改使其可以用原子函数来计算,避免了内存写入冲突。给出了它们数据并行处理的CUDA实现方案,并与CPU串行程序进行了对比,得到了较高的精确度和10倍的加速比。