加速器工具箱的并行优化

来源 :中国科学院研究生院(上海应用物理研究所) | 被引量 : 0次 | 上传用户:grchenpk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
以同步辐射实验为目标的加速器正追求更小的发射度,加速器越来越复杂,原件个数也随之增加。现代大型加速器中,加速器元件个数都以千计,因而在加速器设计及研究过程中需要大量的计算。除线性磁聚焦设计外,由于磁铁制造误差,以及其非线性原件引入的非线性问题无法给出其精确的解析解,为了优化这些非线性参数,需要做大量的粒子追踪计算。例如,在使用模拟追踪粒子运动来计算动力学孔径时,在磁铁元件中加载使用不同组别的磁场误差数据分配方式作为泰勒级数分量,通过反复检查评估制造误差在各个级数上的分布状况,以此优化可能的制造误差的分配,以期望获得尽量大的动力学孔径。在现代高能环形加速器中一般均采用强聚焦四级铁,这将引入强色品,为了校正色品采用了大量的色散六极铁。六极铁的引入带来了非线性效应,这将导致大振幅的粒子运动不稳定,影响到注入效率和束流寿命。针对不同类型环形加速器动力学孔径的限制,加速器物理学家进行了很多研究和优化。在研制一台加速器的过程中,依据粒子运动的追踪结果来确定六极铁的设置和对磁铁制造误差的要求属于十分繁重的工作。对于一台较大规模的加速器,这些粒子追踪计算需要很多的计算时间。提高计算的效率,减少计算程序运行的时间,可以大大缩短研究的周期,更快的进行相应参数的调整,以获得目标结果。采取并行计算方法能有效加快计算程序的运行速度。并行计算方法可以分为两种:使用GPU并行运算;使用多核CPU并行运算。本文通过分析加速器工具箱(AT)的程序工作原理以及运行流程,测试基于CUDA的GPU并行计算;测试基于OpenMP-MPI的混合编程并行计算。最终采用提高计算速度效果最明显,符合计算要求的OpenMP-MPI并行计算方法,之后以此为基础搭建多核心PC机的计算机群平台用于运行加速器物理相关计算程序。计算平台综合了消息传递和共享内存的特点,在计算底层使用共享内存(SMP),在计算顶层使用非一致内存访问(NUMA)实现节点内外的两级并行。由MPI处理计算节点之间进程级粗粒度并行,OpenMP解决集群节点内部单处理器多核心的交互,提供线程级细粒度并行。理论和数值分析表明,OpenMP-MPI混合并行与AT计算程序结构很好的结合起来,通过避免节点内部通信,改善负载平衡,提高了并行效率。并且该平台易于扩展,可以通过增加计算节点使得平台计算速度线性的增长来实现更庞大的计算目标。最后论文总结了所做工作,以及提出了进一步加快计算速度的方法。
其他文献
在压水堆核电站中,反应堆堆芯为整个反应堆系统提供能量,是一回路的关键设备。而燃料组件是堆芯的重要组成部分,燃料组件的流场特性对于系统的正常运行影响巨大。同时由于燃
核反应微观数据是各种核技术应用等方面的基础数据。随着我国钍基熔盐堆项目的启动,大量的核反应数据被需求。尤其中子反应的核数据更是不可缺少的。我们结合国际以及国内核
本文首先介绍了三轴原子核研究现状及其相关有趣的物理问题。随着实验技术的发展以及理论模型的不断深入,人们对原子核形状有了越来越全面的了解。目前很多有趣的原子核结构
上海软X射线自由电子激光(SXFEL)与大连极紫外相干光源装置(DCLS)是国家重大科技基础设施建设项目,束流稳定性的好坏是影响自由电子激光(FEL)性能的重要因素之一。机械支撑系统为FEL
文章运用三维激光扫描对某工地大型土堆进行了扫描测量, 并对点云数据进行拼接、 切割、除燥等处理, 建立目标区域地面数字模型.利用 RiscanPro和CASS软件进行了土方量的计算
<正>1976年迈克尔·简森的《关于会计研究现状与会计管制的思考》(Reflections On The State Of Accounting Research And The
"敬"是中国儒家思想中的重要范畴之一,二程的"敬"工夫论是修身养性的根本方法,体现了宋代理学道德修养论的特色,对中国伦理文化影响很大。二程在日常的伦理纲常实践中,修养侧重有
论文主要分为三部分,第一部分提出新规划法颁布后要重新认识城乡规划学科的地位,编制城乡规划的实质是制订一份法律文件,城乡规划的本质是公共政策:第二部分针对如何正确全面
形象创造在动画电影创作中具有重要的地位、意义和作用,形象是否成功在很大程度上决定着一部动画电影的成败。2015年度国产动画电影的形象创造从整体上并未完全改变长期以来
本文主要对最新设计的中国氦冷固态实验包层模块(CN HCCB TBM)在国际热核聚变实验堆(ITER)上进行实验后的退役工作进行了相关分析。TBM测试是ITER三大工程目标之一,对验证聚