异构并行机上快速求解线性方程组

来源 :中国工程物理研究院 | 被引量 : 3次 | 上传用户:heck502
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大型稀疏线性方程组求解是科学和工程计算中的一个基础共性问题,由于它所耗费的时间在整个计算时间中占有很大的比重,从而快速求解线性方程组成为高效数值模拟的关键。近年来,图形处理器GPU得到了迅速的发展,已经成为高度并行的协处理器,特别适合于计算密集型、高度并行的计算。如今,越来越多的高性能计算机在向具有协处理器的异构方向发展,面向异构并行机开发高效的并行算法具有重要的意义。  Krylov子空间方法是常用的解大型稀疏线性方程组的迭代法,稀疏矩阵向量乘(SpMV)是Krylov子空间方法中影响性能的最关键的基本运算之一,本文首先关注的是GPU上SpMV的高效求解。对于一般矩阵,提出了一种新的稀疏矩阵存储格式BiELL——基于二分法的Ellpack格式,这种格式可以更好地做到负载均衡。类似于BiELL格式的构造,本文还提出了基于二分法的JAD格式(BiJAD)。数值试验表明与已有的格式相比,BiELL和BiJAD格式在GPU上可以得到更高的性能,特别是对各行非零元素个数差异较大的矩阵。  接着我们将BiELL格式和BiJAD格式的SpMV应用于Krylov子空间方法中,得到类似的结论,即对于大多数不规则矩阵,基于BiELL和BiJAD格式的解法器的性能优于基于其他格式的。并完成了Neumann多项式预处理程序,通过数值试验,调整参数来加速收敛,结果表明当多项式次数取奇数时,可以明显的改进收敛性,且考察了最优多项式次数的选择;与ILUT/IC预处理技术相比,多项式预处理的加速效果显著。  最后对用五点差分离散Poisson方程得到的线性方程组,在异构并行机上用共轭梯度算法求解,与只用CPU的并行计算相比,迭代时间明显减少。在实现SpMV时,运用计算与通信重叠技术,即先在CPU间发送数据,然后GPU上计算内点,同时CPU接收数据并计算边界点,数值试验表明程序性能有所提高。
其他文献
该篇论文由四章组成,分别讨论了几类中立型差分方程的定性性质.在第一章,我们获得了方程振动的充要条件;在第二章我们讨论了方程的渐近性;在第三章,我们研究了方程正解的存在
(k;g)-笼是指具围长g和k-正则图中那结顶点数最小的图.文[7]中给出了面下的猜想,设计G为一个(k;g)-笼,则它的每一个g-圈C是不可分离的(nonseparating)(也就是说,对G中任意的g
该文在一类非Lipschitz条件下利用常微分方程的比较定理得到了倒向随机微分方程(简称BSDE)适应解的局部存在唯一性并在一定的条件下得到了全局解.另外该文还讨论了局部空间非
该文采用Elie Cartan活动标架法,研究了常曲率和拟常曲率Riemann流形的常平均曲率超曲面,得到了超曲面为全测地的一个充分条件和三个推论.
“切换”作为一种控制思想,早已在控制论中得到应用,典型的代表就是控制变量在其约束的边界上取值的Bang-Bang控制。由于切换系统大大缩短了控制器的运行时间,减少了功率的输出,
K表示完全二部图,其两个部分点集X和Y分别具有m和n个点,Λk表示完全二部多重图,它是由K的每条边重复λ次而得到的多重图.如果Λk的边集可以划分为Λk 的K——因子,则称λ的K
被中断4年之久的人民币期权交易或将重启:彭博社引述消息人士称,国家外汇管理局已经征求了部分银行的看法,人民币期权交易最快可能在两个月内推出。2010年12月15日银行间市场交易商协会的一位负责人也证实了人民币汇率期权交易将推出的消息,并指出具体时间未定。在我们看来,人民币期权交易重启正当其时。尤其是在当前人民币升值和通胀的压力下,推出人民币期权将为银行管理风险多提供一种手段,对企业而言也能规避一些
中国海岸线较长,温带、亚热带和热带构成了沿海地区复杂的海洋环境。海洋给各个地区带来可观的经济效益和利润的同时,也带来了一些较为严重的甚至不可逆转的海洋灾害,如:风暴潮、