论文部分内容阅读
流体系结构是近年来提出的一种源于媒体处理的高性能体系结构。这种结构针对流媒体应用的计算、访存和通信特征,采用大规模的运算阵列和多级存储体系结构,通过显式管理片上数据移动来隐藏访存和通信延迟,大幅度提高计算效率,但需要采用流编程模型实现串行程序的流并行处理。这种结构及其编程模型是否适用于其它的数据并行类应用领域,如科学计算,数字信号处理,网络安全等,是当前国际上热点的研究问题。
本文通过对各种数据并行类应用在流体系结构下的并行化技术的研究,对并行化的效果进行分析评估,系统地总结了流编程模型的特征及其适用性。
具体的研究内容和成果包括以下几个方面:(1)对流体系结构进行了全面的研究,包括流处理的基本思想、核心级与流级硬件结构、流程序设计模型和编译技术,以及应用流化技术。(2)以Imaigne流处理器模拟器Isim为实验平台,实现了媒体应用JPEG编码程序在流体系结构上的映射,详细剖析了该应用在两级流编程模型下的并行程序设计过程,包括流数据的组织、核心计算程序的划分以及具体实现。提出流级和核心级的程序优化方案,并给出优化前后的性能比较。(3)从其它几种数据并行类应用中,选取了快速傅立叶变换FFT(数字信号处理)、LU矩阵分解(科学计算)、高级加密算法Rijndael(网络安全),实现了这些程序在流处理器上的流并行化处理;分析了这类应用的控制和访存行为;归纳和总结了数据并行类应用的流并行程序设计方法。(4)通过对数据并行类应用流程序的性能评测,与传统高性能处理器和专用处理器进行比较,给出了流体系结构的应用适用性分析。
实验结果表明,流体系结构能够很好地适用媒体、信号处理、许多重要的科学计算和网络安全应用领域。但为了更好地适应更广泛的数据并行类应用,需要在体系结构模型和编程模型进行多方面的改进,本文的实验研究工作为分布式的流体系结构设计提供了依据。