基于DCU加速器件的液滴运动变形数值模拟研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:klzhang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算流体力学(Computational Fluid Dynamics,CFD)是一门使用计算机技术来研究数学、流体力学的交叉学科,液滴运动变形数值模拟是计算流体力学仿真模拟的重要应用领域。在不同流场的相互作用下,液滴形态在计算机中的描述与跟踪具有较高的时间复杂度,亟需利用加速器实现高效的并行模拟计算。深度计算单元(Deep Compute Unit,DCU)是我国自主研发的类GPU(Graphic Processing Unit)加速器件,内部众多的计算单元使其更适合处理大规模数据密集型计算,现已部署于众多异构超算平台上。针对国产DCU平台缺少CFD算法的异构实现,以及异构液滴模拟相关文献中缺少根据具体加速器硬件特性对算法进行通信、访存方式优化的问题,本文面向CPU+DCU异构体系对液滴变形模拟并行技术展开研究。论文的主要工作及贡献如下:(1)设计实现了液滴运动变形数值模拟在CPU的串行C版本,将浸没边界法(Immersed Boundary Methods,IBM)用于不可压缩和不可混溶Navier-Stokes方程控制的两相流计算,使用有限差分法离散控制方程,通过静态分析得出整个程序中最耗时部分为压力泊松方程的计算,同时确定程序的可并行性,为模拟在DCU平台的移植提供了基础。(2)在单DCU上实现并优化异构的液滴变形模拟,遵循HIP(Heterogeneous-compute Interface for Portability)异构编程模型,结合算法原理以及DCU加速器硬件体系架构的特性,将泊松方程经过有限差分处理为线性方程组,进而将此方程组作为数值线性代数问题进行异构计算,初步实现了CPU+单DCU的异构液滴变形模拟;在异构版本基础上优化数据访存方式,通过使用常量内存、寄存器和片上高速存储空间(Local Data Share)解决数值模拟过程中数据冗余访存、内存占用过高、运行效率低下的问题,实现异构版本在单DCU上的进一步优化。(3)实现了多DCU上的高精度异构液滴变形模拟,由于模拟精细度提高后数据规模成倍提升,单DCU的峰值性能难以满足高带宽和高算力的计算需求;为了解决高精度下液滴变形模拟的计算效率问题,利用MPI+HIP-C的混合编程模式实现主机端到多设备端的数据传输和任务执行的并发,完成了多DCU上的异构液滴变形模拟,充分利用了本平台节点内多个DCU的硬件特性获得效率的进一步提升。实验结果表明,单DCU上并行实现后程序相较于CPU串行取得1.96的加速比,单DCU上优化后相较于CPU串行效率取得了2.34的加速比,使用4个DCU优化后相较于单DCU上优化后的结果取得了2.41倍的加速比,证明了CPU+DCU异构体系对于液滴变形模拟实现的可行性及高效性,提高了两相流中液滴变形模拟的执行效率,扩充了国产DCU平台的应用生态,为其他CFD液滴模拟相关工作在该平台上的实现及优化工作提供了参考。
其他文献
半导体光催化材料能够利用太阳能降解和矿化水中各类有机污染物,已成为当今新材料领域的研究热点。其中,半导体g-C3N4因其独特的电子结构、合适的能带隙、良好的氧化还原能力且无毒稳定,已成为一种很有前途的可见光光催化剂。为解决目前单一g-C3N4光催化材料导电性较差、比表面积小、活性位点少以及光生电子-空穴对易复合等问题,本文从带隙设计、形貌控制和构建异质结出发,通过将二维层状材料Ti3C2与g-C3
学位
针对长臂架混凝土泵车转台主焊缝计算结果不准确、计算效率不高的问题,提出基于子模型技术对焊缝进行精细化计算的方法。对转台进行整体计算分析,评估转台主焊缝区域应力;建立转台主焊缝区域的子模型,并在子模型中按照实际参数建立焊缝模型;计算子模型主焊缝在不同网格单元大小下的应力,分析应力收敛性,并验证子模型切割边界的可靠性;优化主焊缝参数,对比优化前后的计算结果,验证优化方案的可行性,并将优化后的参数应用于
期刊
美育是学生全面发展的一个重要组成部分,作为学校美育实施重要形式的美育课程,对于提升学生的审美素养起着关键作用。它不仅能帮助学生形成健全的人格,还能与德育、智育、体育、劳动教育相辅相成,具有以美育德、以美启智、以美健体和以美促劳的特殊价值。除此之外,美育课程还能提高教师的审美素养,促进学校的特色化办学和学科特色化发展以及社会人文资源的建设与发展。初中阶段的学生正处于身心发展的关键时期,落实学校美育课
学位
单元作为有限元法的基础,以单元刚度矩阵的形式参与有限元计算,对结果有着重要影响。各种有限元软件提供了许多常规单元,如梁单元、板壳单元和实体单元等,这些单元的刚度矩阵推导方式和刚度矩阵形式均是明确的。但在土木工程结构分析领域,除了前述常规单元以外,往往还需要多种连接单元,如弹性连接单元和主从约束等,但查阅资料发现,这些连接单元刚度矩阵的推导方式和具体形式是不明确的。因此,本文以有限元软件MIDAS和
学位
在全面建成小康社会的背景下,乡村振兴是国家统筹城乡协调均衡发展的核心和关键。乡村教育的发展与乡村振兴的成效息息相关,当前我国乡村教师的持续流失导致我国乡村教育质量不断下滑。随着近些年国家的持续扶持和对教师队伍的不断补充,乡村教育现状虽略有改善,但仍面临衰败趋势,乡村地区教师流失问题仍悬而未决。当前,建设一支稳定的乡村教师队伍,减少乡村教师的流失是切实改善乡村教育现状的重要举措。因此,关注乡村教师流
学位
骨关节炎是一种慢性进行性骨关节疾病,会严重影响人们的正常生活。在临床上,通常会采用自体软骨移植或同种异体软骨移植对其进行治疗。然而,由于这两种骨修复材料各自分别存在来源有限以及免疫原性等问题,越来越多的研究通过制备骨组织工程支架来修复骨损伤。生物活性玻璃具有较高的生物活性,还具有促进血管生成和抗菌特性,能够与周围组织形成较强的界面结合。本文将溶胶-凝胶法制备的生物活性玻璃与壳聚糖和海藻酸钠进行复合
学位
2020年9月,教育部等7部门联合印发的《全国青少年校园足球八大体系建设行动计划》,计划中提出为了能够使我国校园足球能够有进一步的发展,需要调动政府、学校、学生、家长以及社会各界对校园足球的参与感和支持度。家庭作为青少年成长发育的重要环境,在学校和社会中发挥着不可替代的作用。本文采用文献资料法、专家访谈法、问卷调查法、数理统计法,通过对郑州市12所中小学的学生家长的进行调查,深入了校园足球开展过程
学位
由信息不对称带来的融资难的问题,仅依靠传统的金融模式难以解决,而借助大数据技术进行风险控制是解决此类问题的有效途径。但随着数据安全和隐私保护的问题日益凸出,数据孤岛问题成为金融科技发展道路上的绊脚石。为解决数据安全、隐私保护及数据孤岛问题,实现多方数据共享来建立更优的智能风控模型,联邦学习给出了解决方案。相比于传统的机器学习模型,联邦学习可以在隐私保护、数据不出门的前提下实现利用多方数据联合建立高
学位
超高性能混凝土(Ultra-high performance concrete,UHPC)是一种力学性能和耐久性能优异的水泥基复合材料,在交通和建筑工程中具有广阔的应用前景。由于制备UHPC的水泥用量大、生产成本高等缺点,其推广应用受到较大限制。本文利用矿物掺合料部分替代水泥,再生细骨料(Recycled fineaggregate,RFA)全部代替河砂等天然骨料,并掺入微丝钢纤维,制备出性能优异
学位
学位