面向高性能计算机全局数组编程模型内存受限问题的研究与优化

来源 :第十七届计算机工程与工艺年会暨第三届微处理器技术论坛 | 被引量 : 0次 | 上传用户:FIGOWEN7
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  高性能计算机在处理更大规模数据时可能遇到内存不足的问题,本文探索了该问题的解决方案.经过对各编程模型的对比分析,本文采用GA(Global Arrays)模型进行优化.GA是PNNL(Pacific Northwest National Laboratory)推出的一种全局数组编程模型,具有编程简洁、运行效率高的优点.但是GA的接口只能在各节点内存上进行操作.当应用程序需要处理更大规模的数据时,会因为内存的不足受到限制.由此,本文提出了DGA(Disk extending Global Array)编程模型,并说明了它的实现方法.然后通过DGA编写的内存受限并行程序,说明DGA会在内存不足时自动将全局数组扩展到磁盘上.通过多种测试用例的实现和评测,证明了DGA可以在不大幅降低程序运行性能的基础上,保障程序的运行.同时文中简单介绍了优化模型已完成的模块,对接下来要做的工作进行了一些展望.最终的DGA将满足在巨型机上的需求.
其他文献
学位
  随着GPU的发展,大量的并行科学计算程序都采用GPU进行加速计算.然而,现有的GPU不支持多个进程同时访问.当一个进程初始化GPU之后,在释放GPU之前,其它的进程是无法使用GPU的.
乳酸菌作为益生菌中颇具代表的菌群,其产品中乳酸菌的数量是衡量该类产品质量优劣的重要指标之一。如何获得含大量乳酸细菌的菌悬液以制备高菌浓、高活性的乳酸菌产品已成为
学位
  本文给出了一种采用开源IP实现低成本基板管理控制器(BMC)的方法,硬件基于ORP架构并采用了SOPC实现方法,软件基于嵌入式Linux,构建了灵活高效的BMC软硬件系统,实现了基于
  高性能计算机对互连传输速率的要求不断提高,使得差分对称带状线成为较优的印制布线方式.实际应用中,互连长通道的建立常用多块印制板的直接或间接连接,为保证信号传输质量,
  容迟/容断网络(DTN)是一个应用广泛的网络模型,具有高延时、低数据率的特点,采用"存储-携带-转发"的信息传递模式,传统网络的拥塞控制机制已经不能适用于DTN网络。如何提高
我国苦苣菜(Sonchus oleraceus L.)资源分布广、产量大,苦苣菜含有蛋白质、多种氨基酸、维生素和微量元素以及丰富的黄酮类化合物,其食用价值和药用价值都非常可观。随着人们
学位
  在中高端服务器系统中,高速连接器的使用越来越普遍。对于高速互连来说,高速连接器在PCB设计中的相关参数对系统传输有重要影响。首先,基于信号传输理论,分析高速连接器在PCB
粉体制备是NTC热敏陶瓷生产中的关键工序之一,制备高活性粉体一直是该行业研究的重点。本论文采用共沉淀法制备NTC热敏陶瓷粉体,研究沉淀工艺条件对最终制品性能的影响,并探
与传统的锂离子电池正极材料LiCoO_2、LiMn2O_4等相比,LiV_3O_8具有放电比容量高、价格便宜、制备简单等优点。但是LiV_3O_8还存在放电平台多,循环性能不够好等缺点,因此其产业化应用还比较困难。本文主要通过溶胶凝胶法、固相法等不同的方法制备LiV_3O_8正极材料,并对其进行掺杂改性等研究,以提高其比容量和循环性能。LiV_3O_8材料的传统制备方法是高温固相法,该法制备的产品