论文部分内容阅读
空间等离子体数值模拟中需要涉及空间中海量粒子的计算,这直接导致了其对大量的计算资源的需求。所以通常使用并行计算和高性能计算机群来进行空间计算模拟的实现。其中空间数值模拟主要使用的的PIC(particle-in-cell)模拟算法是一种将大量的等离子体粒子利用网格计算来仿真系统物理特性的一种计算方法。目前,随着图形处理器(GPU)和英特尔集成众核架构协处理器(MIC Many-Integerated-Core)介入高性能计算领域,越来越多的大规模科学计算开始采用异构并行计算架构的高性能计算平台来加速和计算实现。如何高效并行地进行PIC模拟也面临着一系列新的挑战,这也是基于PIC的等离子体物理模拟领域的研究热点之一。在本文中,我们首先实现了并行的PIC等离子体模拟,然后在其基础之上扩展至使用GPU与MIC的异构并行计算平台。并分别针对GPU与MIC的进行了并行PIC模拟优化。其中GPU主要使用异步流传输,线程块优化,存储器访问优化等优化,而MIC主要使用线程扩展,指令集向量化等优化。为了体现异构并行计算平台下的并行加速效果,我们利用英特尔Ivy-Bridge架构CPU处理器,英伟达的Kelper架构的GPU计算卡和英特尔的Knight Corner协处理器进行针对性模拟,并对三者的计算性能进行比较。研究表明,针对空间数值模拟中的PIC等离子体模拟使用GPU或者MIC的异构并行计算平台比使用单纯CPU的计算平台的计算性能更高且成本更低。而且使用GPU平台可以进一步实现空间模拟数据的可视化。利用GPU与MIC异构计算平台进行并行计算将不断推动科学计算中使用高性能并行计算体系架构的最新研究与发展。