论文部分内容阅读
近年来,全球气候变化与生态环境问题愈来愈受到世界各国人民的高度重视。地球系统模式是地球气候和生态环境预报的主要手段。由于全球模式的空间分辨率较低,无法反映区域内部的气候特点和差异,动力降尺度即全球模式与区域模式的嵌套计算成为地球系统耦合模式的研究热点之一。动力降尺度具有物理意义明确、面向覆盖区域的所有格点等诸多优点,但面临着实现难度大、过程复杂和计算量大的问题。本文立足于中国科学院地球系统模式CAS-ESM研发需求,针对全球大气环流模式IAP AGCM4.0与区域模式WRF嵌套(耦合)计算存在的性能问题,研究相关并行算法和改进方法,为地球系统模式准确高效地运行,提供技术支撑。 本文主要从耦合技术、并行优化算法和性能评测三个方面介绍研究工作,具体研究内容和贡献总结如下: (1)耦合技术方面。第一,研究了IAP AGCM4.0与WRF耦合算法理论,以及IAP AGCM4.0与WRF耦合的并行机制;第二,研究了IAP AGCM4.0与WRF离线嵌套和在线嵌套方法;第三,研究了原CAS-ESM中IAPAGCM4.0与WRF通过CPL7耦合的实现过程,挖掘存在的问题,为后续的改进提供基础。 (2)并行优化算法方面。第一,针对IAP AGCM4.0原一维剖分并行算法可用处理器个数受限问题,提出了阶段混合二维区域剖分并行算法,显著提高了IAP AGCM4.0的可扩展性,有效并行规模由32个CPU核心增加到1092个CPU核心;第二,针对高纬滤波的负载不均衡问题,基于FFTW3设计和实现了高效的IAP FFT99算法软件包,用于IAP AGCM4.0高纬滤波,较原FFT99软件包性能提升了39%;第三,针对耦合数据处理模块METGRID存在的严重负载不均衡问题,设计和实现了新的广度优先搜索插值并行算法,提高了耦合计算的速度和并行效率。数值试验表明数据处理模块的计算速度加速大约7倍,整个CAS-ESM系统能加速大约2倍;第四,针对IAP AGCM4.0与WRF之间数据通信效率低下问题,设计了新的并行数据通信算法。该算法能减少通信开销,提升IAP AGCM4.0与WRF耦合的计算效率;第五,针对CPL7不适合进行IAP AGCM4.0与WRF三维耦合问题,提出了新的三维耦合并行算法,减少不必要的数据转换通信,进一步提升了IAP AGCM4.0与WRF耦合的计算效率,这一工作也为后续三维耦合器的研发奠定了基础。 (3)性能评测方面。第一,通过对北京“7·21”暴雨事件的模拟,研究和分析了IAP AGCM4.0与WRF离线和在线嵌套的差异所在,评估了IAPAGCM4.0与WRF嵌套的气候模拟能力;第二,将上述研究成果和性能改进集成到CAS-ESM系统中,通过不同网格规模的数值试验,评估了IAP AGCM4.0与WRF嵌套的并行性能以及优化后CAS-ESM整体的并行性能;第三,给出了优化后的CAS-ESM浮点计算性能;第四,提出了一个适用于地球系统模式性能评测的通用方法,给出了CAS-ESM系统高输出和低消耗的最佳配置。 通过以上研究工作,地球系统模式CAS-ESM并行计算性能得到了较为全面的优化和提升。由于IAP AGCM4.0与WRF程序结构复杂、代码量巨大和算法多杂,造成了并行耦合计算实现难度很大,本文的工作还体现在算法的分析和程序代码的实现上。