面向媒体应用的处理器体系结构研究与设计

来源 :中国科学院声学研究所 | 被引量 : 0次 | 上传用户:koukou333
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
媒体应用的迅猛发展对微处理器设计提出了新的要求和挑战:处理器必须具备强大的数据处理能力和控制能力,必须提供足够的灵活性来适应快速发展的多媒体处理标准和支持各种形式的多媒体应用。   为了在设计的早期完成处理器指令集体系结构的设计和验证,本文提出了基于体系结构描述语言的设计空间搜索技术,可以针对不同应用快速定制满足需求的处理器体系结构。本论文以SuperV3处理器设计为基础,采用体系结构空间搜索技术研究面向媒体应用的处理器体系结构,探索媒体处理增强的关键技术。   本文研究了多媒体处理算法的特点,综合运用VLIW和SIMD技术,开发了面向媒体应用的指令集,提高了数据处理能力,减少了媒体应用程序的指令空间;采用开放式总线结构,提高了数据处理带宽及数据供给能力;采用两个专门的地址运算单元,提供循环缓冲、位反序等多种寻址方式,增强了数据供应能力;采用数据排队缓冲提供存储器到寄存器组的高速数据传送;针对媒体应用中的关键算法,设计了加速运动估计的SAD指令等媒体专用指令,媒体处理性能得到了进一步提升。   为了提高媒体数据处理能力,本文研究了高性能浮点乘法器结构,提出了浮点乘法器中的快速舍入方法。快速舍入方法通过预测和选择来得到最终的尾数值,避免了传统舍入方法中大位宽加法器的使用,逻辑简单,硬件开销和关键路径延时显著减少。应用快速舍入方法设计的单、双精度浮点乘法器与采用传统舍入方法的浮点乘法器相比,性能提高20%左右,并且精度越高,性能提高的空间越大。   为了对图像压缩编码进行硬件加速,本文提出了一种基于提升算法的低功耗并行的二维离散小波变换VLSI结构。该结构行、列并行处理,不需要额外的缓存来存储中间变换系数;共享提升结构中的主要运算部件,同时处理两行数据,运算部件一直处于工作状态,硬件利用率接近100%;采用嵌入式边界扩展电路,减少了片上需要的缓存及对外部存储器的访问,有效地降低了整个设计的功耗。整个结构采用0.18μmCMOS工艺设计,关键路径延时为5.6ns。该模块可以作为IP嵌入到媒体处理器中对媒体应用进行硬件加速。  
其他文献
科技电子文献是科研工作者发布研究成果、交流信息的重要载体。而科技的飞跃发展以及互联网的广泛普及,造成电子文献海量涌现,迫切需要一个能够辅助科技工作者快速有效获取相关
昆虫在竞争激烈的自然环境中不断繁衍生存,主要受益于其敏锐的嗅觉系统。昆虫通过发达的嗅觉系统感知同类或天敌发出的性信息素或预警信息素,不仅能寻找配偶进行交配和躲避天敌
人类前置的双眼从不同角度观看同一场景,双眼图像存在微小的差异,即视差。这种由双眼引起的视差经大脑处理而形成具有深度感知的立体视觉,使人类可以准确判断出场景中物体的
本文通过对荣华二采区10
期刊
导弹飞行姿态信息的获取是现代化精确制导武器研究过程中的关键技术之一,而惯导系统传感方案、姿态算法、电路设计及试验环境是影响导弹姿态信息获取可靠性的主要因素。 本
神经营养素能够影响脊椎动物神经元的增殖、分化、凋亡、存活等生命过程,但其功能的发挥则需要Trk和p75NTR两种膜受体的存在。RanBPM(Ranbinding proteinin microtubule orga
在实时控制系统中由于受到场地,距离,环境以及危险性等多种原因的限制,不利于我们进行这些实时控制。本文提出一种基于Web的实时控制系统,它融合了现场采集控制技术与网络上
合成孔径雷达[1](Synthetic Aperture Radar,SAR)是一种高分辨率的成像雷达,具有全天时、全天候、高分辨率的特点,在军事和民用领域得到了广泛的应用。近年来随着合成孔径雷达的
In the genus Oryza, more than half of species are polyploids. These polyploids consist of the BC, CD, HJ and HK genome, and are distributed in Asia, Oceania, Af
随着人类开发海洋的速度逐渐加快,水声通信技术,尤其是浅海水声通信技术,越来越受到人们的重视。如何克服浅海水声信道带宽有限、多径复杂、信噪比较低、多普勒效应严重等种种限
学位