【摘 要】
:
科学计算涉及到航空航天、现代生物与医学、石油勘探、环境科学、核模拟等国民经济和国防建设各个重要领域,矩阵分解、求逆的矩阵运算则是科学计算的基础和关键。因此,加快矩
论文部分内容阅读
科学计算涉及到航空航天、现代生物与医学、石油勘探、环境科学、核模拟等国民经济和国防建设各个重要领域,矩阵分解、求逆的矩阵运算则是科学计算的基础和关键。因此,加快矩阵分解、求逆的运算速度具有重要的理论意义和实际应用价值。本文基于FPGA平台研究对称和对称正定两类矩阵分解、求逆运算的细粒度并行加速技术,主要完成了以下工作:(1)对称正定矩阵是实际应用常见的一类矩阵,针对正定对称矩阵Cholesky分解也是科学计算中一种重要矩阵运算。本文首先分析了算法的数据依赖关系,提出了Cholesky分解细粒度并行算法与结构。基于所提出的并行算法与结构,实现了单精度浮点Cholesky分解硬件加速器,并建立了该并行结构加速器的性能模型。(2)研究了对称矩阵LDLT分解加速器的细粒度并行结构与实现。同Cholesky分解类似,首先分析了算法的数据依赖关系,提出了LDLT分解细粒度并行算法与结构,然后实现了单精度浮点LDLT分解硬件加速器,最后给出该结构加速器的性能模型。(3)研究了基于Cholesky分解矩阵求逆的细粒度并行实现结构。在Cholesky分解细粒度并行实现的基础上,研究了三角矩阵求逆和三角矩阵乘的细粒度并行实现,并提出了三角矩阵存储方法。最后实现了单精度浮点矩阵求逆硬件加速器,并对该加速器的性能进行了分析。
其他文献
为实现飞机装配的全三维化,提出生产现场中三维工艺装配指令的实现方法.将三维工艺装配指令中零件三维模型与零件列表相关联,利用文字与仿真动画相结合的技术,实现生产现场装配指
本文设计了一种利用CFRP筋完全代替钢筋的新型桥面板结构,通过抗弯性能对比试验,对CFRP筋混凝土新型桥面板与普通钢筋混凝土桥面板的受力性能进行较为系统的对比研究,得到了
沃尔沃铰卡在井采作业时,工况条件较为复杂,运输作业时铰接处受碰撞频率高,特别是重车的情况下,铰接销孔极易变形及磨损,造成铰接头故障频次高、铰接轴承损坏及铰接销断裂等
本值班签到系统以MVC为开发模式,采用JSP为前台页面开发技术、servlet开发跳转等流程控制的控制器,Java语言开发业务逻辑等模型,以SQL SERVER2008为数据库,tomcat为WEB服务器
<正> 中国建筑科学研究院编制的 GB 50223—2008《建筑工程抗震设防分类标准》,于2008年9月,由中国建筑工业出版社(http://www.cabp.com.cn)出版发行,定价10.00元。该标准自2
为了解决困扰建筑行业多年的工程款拖欠问题,《合同法》第286条规定了建筑工程优先受偿权制度,该制度是在特定的社会环境下针对特定的社会问题而设定的,对于矫正建筑工程发包
针对传统变压器冷却器控制方案响应慢、中间继电器多、故障率高的问题,提出了一种基于PLC控制的新型变压器冷却控制系统,从系统功能设计、冷却系统设计等方面对该系统进行分
本文采用三种方法分析了受力梁发生弯曲时其各部分所受内力的大小,即如何快速、准确地画出剪力图和弯矩图,最后进行了对比。
在全球化浪潮中,文化的全球化趋势已然愈演愈烈,全球文化间的交流与碰撞成为国家间、民族间对话的主平台,而大众文化则无疑成为其交锋的集中体现。在当今时代,大众文化与主流
我国城市照明自1989年起步,已经历了二十多个年头,随着中国经济和社会的快速发展,我国城市建设突飞猛进,城市面貌日新月异,城市照明也像其他行业一样在逐步前行,在短短20多年