材料计算大规模异构并行算法研究与实现

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:ywh831002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
第一原理计算是科学计算中最重要的一类计算。它以原子位置坐标为基本参数,通过平面波展开求解Kohn-Sham方程,得到精确的材料的光、电、磁等物理性质。然而其求解速度和求解规模仍是亟待解决的问题。尤其是材料基因组等大型材料搜索计划所倡导的高通量计算,对第一原理计算软件的绝对计算速度提出了更高的要求。  大型异构超级计算机为打破第一原理计算的绝对时间限制提供了新的机会。以图形处理单元为代表的异构处理部件,在设计时更多考虑能耗的因素,被普遍认为是百亿亿次超级计算机的必要部件。目前,以英特尔的集成多核架构处理器和英伟达的图形处理器为异构部件的天河2号和泰坦是超级计算机排名的前两名。  本文在异构超级计算机上,研究了平面波方法第一原理计算在大规模异构下的算法和并行,对直接局域密度近似方法和大规模线性标度算法分别进行研究,主要内容包括:  1.直接局域密度近似方法异构并行研究。该工作以汪林望博士的平面波计算软件PEtot为基础,提出第一原理异构架构下混合并行模式,从而将局域密度近似方法中的快速傅里叶变换置换到单个图形处理器中计算;重新设计异构算法,全部计算放到图形处理器中;并且提出一种普适于残量收敛计算的数据压缩算法,减少MPI数据通信。这一工作最终形成了异构第一原理计算软件SC_PEtot。测试结果显示,相比2016年刚刚发布的VASP软件的GPU版本,SC_PEtot代码计算速度有2-4倍的优势。  2.异构材料算法量化分析模型的建立。该工作针对SC_PEtot软件,建立了一套有效的材料算法量化分析模型,它主要用于分析异构材料计算软件的可扩展瓶颈和预测材料计算软件在超级计算机上的运行时间。针对不同体系的材料系统,该模型的预测结果与实际运行时间误差最大为8%。  3.线性标度大规模异构并行算法研究及优化。该工作以线性标度三维分片算法(LS3DF)为基础,研究了在数千图形处理器并行时的第一原理计算算法特征,针对异构超级计算机的硬件特点,作者将计算和通信部分分别进行了修改,特别是改变了LS3DF的原有的全局通信模式。在泰坦超级计算机上的测试结果显示,异构线性标度三维分片算法比原有代码加速4到10倍。
其他文献
作为目标文件的集合,C语言函数库为系统运行和软件开发提供了必要的支持。64位技术的普及为计算机的发展注入了强劲动力。UniCore-3处理器是我国自主研发的64位处理器。为支持
语义角色标注的目的是分析句子中特定动词的论元结构,识别出与该动词具有搭配关系的论元并分析这些论元的语义角色。近年来,有指导的语义角色标注方法已经得到了比较全面的研
查询意图被定义为查询背后的信息需求,正确分类用户的查询意图,能够帮助商业化搜索引擎优化检索结果,提供更加准确的检索服务。由于用户的查询  关键词一般较短(平均长度2-3),
软件开发是一个迭代的过程,通常需要反复经历代码的编辑、编译、链接、运行和调试。这期间将使用到各种各样的开发工具,包括编辑器、编译器、链接器、汇编器、函数库、调试器等
基于NAND闪存的固态盘(SSD)作为磁盘的缓存设备已经广泛地应用在数据中心存储系统中。已有的固态盘缓存系统设计没有充分考虑闪存介质的特性,如擦后写、擦写粒度不对称、擦写
随着人类文明的不断发展,科技的不断进步,尤其是计算机学科的发展和Intemet的发展,人们需要面对的数据量越来越大。如何从海量数据中获得自己想要的知识,一直是一个备受关注
随着互联网的发展,电子商务逐渐走进越来越多人的日常生活。如何从为数众多的产品中,选择最符合自身需求的产品,是用户购买决策的重要环节之一。互联网上产品的图片、参数、
作为当前互联网最主要的传输层协议之一,TCP为大量的互联网应用提供数据包可靠传输服务。TCP性能直接影响互联网业务的服务质量,TCP数据传输性能瓶颈分析与优化一直来都是网络
在当今社会中国际化越来越明显,语言的交流成为适应这一变化的重要途径。怎么能在有限的条件下来提高非母语学习者学习语言的效率和效果成为一个亟待解决的问题,通过计算机来辅
近年来,在油气开发过程中,地震资料在开发井的设计中使用越来越广泛,地震资料中丰富的区块、测井等信息对油气开发起到了很好的指导作用。但是,在使用这些信息的过程中,由于对很多