论文部分内容阅读
第一原理计算是科学计算中最重要的一类计算。它以原子位置坐标为基本参数,通过平面波展开求解Kohn-Sham方程,得到精确的材料的光、电、磁等物理性质。然而其求解速度和求解规模仍是亟待解决的问题。尤其是材料基因组等大型材料搜索计划所倡导的高通量计算,对第一原理计算软件的绝对计算速度提出了更高的要求。 大型异构超级计算机为打破第一原理计算的绝对时间限制提供了新的机会。以图形处理单元为代表的异构处理部件,在设计时更多考虑能耗的因素,被普遍认为是百亿亿次超级计算机的必要部件。目前,以英特尔的集成多核架构处理器和英伟达的图形处理器为异构部件的天河2号和泰坦是超级计算机排名的前两名。 本文在异构超级计算机上,研究了平面波方法第一原理计算在大规模异构下的算法和并行,对直接局域密度近似方法和大规模线性标度算法分别进行研究,主要内容包括: 1.直接局域密度近似方法异构并行研究。该工作以汪林望博士的平面波计算软件PEtot为基础,提出第一原理异构架构下混合并行模式,从而将局域密度近似方法中的快速傅里叶变换置换到单个图形处理器中计算;重新设计异构算法,全部计算放到图形处理器中;并且提出一种普适于残量收敛计算的数据压缩算法,减少MPI数据通信。这一工作最终形成了异构第一原理计算软件SC_PEtot。测试结果显示,相比2016年刚刚发布的VASP软件的GPU版本,SC_PEtot代码计算速度有2-4倍的优势。 2.异构材料算法量化分析模型的建立。该工作针对SC_PEtot软件,建立了一套有效的材料算法量化分析模型,它主要用于分析异构材料计算软件的可扩展瓶颈和预测材料计算软件在超级计算机上的运行时间。针对不同体系的材料系统,该模型的预测结果与实际运行时间误差最大为8%。 3.线性标度大规模异构并行算法研究及优化。该工作以线性标度三维分片算法(LS3DF)为基础,研究了在数千图形处理器并行时的第一原理计算算法特征,针对异构超级计算机的硬件特点,作者将计算和通信部分分别进行了修改,特别是改变了LS3DF的原有的全局通信模式。在泰坦超级计算机上的测试结果显示,异构线性标度三维分片算法比原有代码加速4到10倍。