高性能并行数值软件性能优化及存储复杂性研究

来源 :中国科学院软件研究所 | 被引量 : 0次 | 上传用户:rainbow03262009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高性能计算已经进入了万亿次机器的时代.围绕着在万亿次高性能计算环境下的并行数值软件包性能优化问题,该文以面向该类计算环境设计的有代表性的并行数值软件包ScaLAPACK为例,从最适处理器网格形状的自动选择,并行近优数据分块大小的自动选择,用户友好的ScaLAPACK应用程序编程接口,对同一算法的不同实现形式从存储复杂性角度的有效区分,和新的面向数值计算的在存储层次和指令级并行的并行计算模型等五个方面进行了研究,并提出了相应的性能优化技术和分析方法.
其他文献
信息高速公路给人类社会带来了新的挑战和机遇,教育作为社会的一个重要组成部分,正面临着一场深刻的变革。传统的以教师、课堂、课本为中心的教学模式将越来越不适应信息社会的
时滞系统(也称纯滞后系统)是一类典型的工业过程.它的纯滞后特性决定了它是一类难于控制的对象.该文从理论和实际应用两个方面讨论了纯滞后系统的控制问题,给出了仿真结果和
计算机辅助教学(CAI)是一项正在蓬勃发展的研究课题,本文对这一课题进行了较深入的研究。本文概述了CAI的理论基础,探索了CAI的发展方向,研究了超媒体模型,提出了超媒体与智能计算
随着图像获取和处理技术的快速发展,数字图像已融入现代人们的生活,利用图像编辑软件可以方便地对已有图像进行润饰、合成等编辑操作,制作出赏心悦目的图片。这些编辑精美的图像
中国兵器装备集团公司又称中国南方集团公司(简称集团公司).地这样一个特大型集团公司,管理业务必然繁忙,信息处理工作量大,信息关系也比较复杂,信息传输渠道多、涉及面广,许
随着网络技术的发展,用户的工作环境已经发展为局域网环境.为了使局域网中的用户的实现更高效率的交流和合作,提高组版的效率,在飞腾组版系统的基础上,开发了飞腾网络组版系
该篇论文主要讨论了主动技术的发展历史、基本原理与实现细节,并对目前的研究结果进行综述,提出了主动结点的结构模型、软件体系结构以及主动结点间的信息流模型.文章的第一
该论文首先综述了IC卡、Java语言及Java智能卡的国内外发展状况,介绍了与Java卡相关的技术——特别是Java虚拟机的技术.第三章研究了Java卡虚拟机的实现方法.而按功能将Java
熔炼炉广泛应用于化工和冶金行业,是中国用电量最大的用户设备之一,其耗电功率从几千到几万千伏安不等.在中国,熔炼炉的控制大多为传统的人工手动控制,不能满足生产工艺的要
该文所讨论的是面向工程制图课中组合体视图的远程教学系统,它是根据组合体视图教学过程中的重点和难点而开发的.在该论文中,首先介绍了基于Web的远程教育的优势和远程教育环