流处理器体系结构上的并行编程模型实验研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:long_teng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
流体系结构是近年来提出的一种源于媒体处理的高性能体系结构。这种结构针对流媒体应用的计算、访存和通信特征,采用大规模的运算阵列和多级存储体系结构,通过显式管理片上数据移动来隐藏访存和通信延迟,大幅度提高计算效率,但需要采用流编程模型实现串行程序的流并行处理。这种结构及其编程模型是否适用于其它的数据并行类应用领域,如科学计算,数字信号处理,网络安全等,是当前国际上热点的研究问题。 本文通过对各种数据并行类应用在流体系结构下的并行化技术的研究,对并行化的效果进行分析评估,系统地总结了流编程模型的特征及其适用性。 具体的研究内容和成果包括以下几个方面:(1)对流体系结构进行了全面的研究,包括流处理的基本思想、核心级与流级硬件结构、流程序设计模型和编译技术,以及应用流化技术。(2)以Imaigne流处理器模拟器Isim为实验平台,实现了媒体应用JPEG编码程序在流体系结构上的映射,详细剖析了该应用在两级流编程模型下的并行程序设计过程,包括流数据的组织、核心计算程序的划分以及具体实现。提出流级和核心级的程序优化方案,并给出优化前后的性能比较。(3)从其它几种数据并行类应用中,选取了快速傅立叶变换FFT(数字信号处理)、LU矩阵分解(科学计算)、高级加密算法Rijndael(网络安全),实现了这些程序在流处理器上的流并行化处理;分析了这类应用的控制和访存行为;归纳和总结了数据并行类应用的流并行程序设计方法。(4)通过对数据并行类应用流程序的性能评测,与传统高性能处理器和专用处理器进行比较,给出了流体系结构的应用适用性分析。 实验结果表明,流体系结构能够很好地适用媒体、信号处理、许多重要的科学计算和网络安全应用领域。但为了更好地适应更广泛的数据并行类应用,需要在体系结构模型和编程模型进行多方面的改进,本文的实验研究工作为分布式的流体系结构设计提供了依据。
其他文献
XML(eXtensible Markup Language)已经成为互联网上数据表示和交换事实上的标准,同时XML安全也引起了越来越多的关注,例如在Web服务中要求服务器拒绝未授权用户对敏感信息的访
在实际的语音应用过程中,如语音通信、语音合成、语音识别等,所使用的语音信号不可避免的受到外来的各种各样的噪声干扰,这些干扰将严重影响语音设备功能的发挥。因此,有必要对被
无线局域网(WLAN)是计算机网络与无线通信技术相结合的产物。无线局域网采用无线的方式实现终端间的连接,与有线局域网相比更加复杂。近年来,无线局域网研究中的主要热点和难点
随着计算机技术的日新月异的发展,视频图像信息在人类认知世界的各个领域发挥着越来越重要的作用。由于人眼受到生理、心理和神经系统调节的限制,分辨率是相当有限的,所以在人眼
自兴起之日起,因特网就一直保持着迅猛增长的势头。随着多媒体业务日益普及,用户对因特网的要求也不再仅仅满足于简单的文件传输,而是要求网络提供安全、快速和多样化的服务。传
无线传感器网络主要以采集环境数据,并为用户提供环境信息的数据服务为主。随着应用的深入和感知数据的多样化,传感器感知到的环境数据中将包含着大量的敏感数据和隐私数据,怎样
基于内容的图像检索己成为当今的一个研究热点。锦峰[16]于2004年提出了一个基于区域的图像检索系统,该系统根据颜色的差异将图像分割成各个区域,将各个区域的特征集做为图像的
学位
当今,随着微处理器制造与集成技术的不断进步与发展,以多核处理器为节点而构成的集群系统以其较高的性价比日渐成为主流的并行计算平台。与此同时,现代科学与工程计算中大规模数
任何没有信息扩张的密码体制都可以看作是置换的结果。而起源于雷达信号设计的Costas阵列,作为一种特殊的置换矩阵,与置换一一对应,经降维所得Costas序列是一种特殊的置换。