指令级并行相关论文
从应用程序中开发利用尽量多的指令级并行度(Instruction Level Parallelism,简称ILP)是现代高性能超标量处理器不断追求更高性能......
指令级并行处理ILP(Instruction-Level Parallelism)是一项增强处理器性能的技术,它通过增加每个时钟周期执行的指令条数而提高性能。......
超标量流水线,超流水线和超长指令等微处理器主要是依赖指令级并行提高性能,但是指令级并行受到了指令相关的影响,造成很大空闲周期。......
随着信息技术的发展,人们需要解决的问题越来越复杂,传统的串行程序设计方法已经无法满足许多应用领域的需要,于是并行计算机和并......
该文在国内首次对嵌入式系统设计方法进行系统的研究;研究过程中首次采用线程集成的概念,并且对线程集成的原理、实现方法以及相关......
随着现代半导体工业的发展,芯片的集成度不断提高,处理器设计朝着分片式的方向发展。对处理器性能的急切需求使充分挖掘程序的指令级......
值预测和指令重用是通过开发程序执行结果的冗余来解决数据相关的两种不同的新技术.本文首先从这两种新技术的原理出发,深入剖析了......
当今的主流DSP在数据级和指令级上都实现了不同的并行技术,而且不断有新的并行技术会被运用到新的DSP内核中.从技术和效率方面看,......
本文阐述了一个新的观点基于软流水,我们从一维向量到二维矩阵将软流水作为一个指令级转换。这样,软流水问题自然地就被分为两个子问......
作为64位处理器架构的IA-64,提供了更高的指令级并行性(ILP),并代表了一种新型微处理器的发展方向.对IA-64二进制指令代码流的自动......
提出扩展选择调度,统一处理循环和非循环代码,对它们不加区分但却分别产生软件流水和全局压缩的效果;程序并行化不需要分层简化,只要顺......
立足于处理器体系结构的研究,结合可重构设计技术以确保密码处理的灵活性是密码协处理器研究的重要方法,其中如何提升密码协处理器......
同时多线程处理器SMT(Simultaneous Multi-Threading)是用于图形、图像及数字信号处理的一种可以实现指令级并行(ILP)和线程级并行(TLP)......
抽象机通常用在软件程序编译器中。提出了一个基于硬件抽象机的处理器设计方法,使用该方法设计了一个Java微处理器,并且利用硬件抽......
魂芯DSP处理器是一款32 bit静态超标量、分簇结构的、支持SIMD的VLIW处理器。魂芯DSP芯片有4个执行簇和3个内存块,但簇间数据传输......
当前,应用程序持续运行性能与高性能计算机峰值性能的差距有扩大的趋势,许多实际应用程序的性能通常只能达到机器峰值性能的5%~10%,甚......
执行效率是衡量DSP程序的性能的重要指标,因而程序的优化就显得十分必要.在TS201的环境下,基于汇编语言,结合MTI(动目标显示)的程序对SIM......
As a program transformation technique,control dependence can be converted to data dependecnce by predi-catted execution ......
分支指令是发掘指令级并行(ILP)的一个主要障碍.IF转换能够有效地删除指令流中的分支,通过删除程序中的某些分支,将控制依赖转换为......
对指令集进行扩展和添加新功能部件是提高处理器性能的有效途径.为了充分利用新的体系结构扩展,已有应用必需经过全新的优化编译.......
谓词支持是IA-64体系结构的新特征,它为发掘指令级并行提供了更多的机会,同时给编译器的设计者增加了难度.谓词是条件执行的依据,......
分支指令与分支预测失败限制了处理器发掘指令级并行(ILP)的潜力.通过If—conversion或Predicated执行将程序中的控制相关转化为数据......
通过对多核处理器体系结构、多核单元内部结构设计及指令级并行运行模式等方面进行深入研究,探索适用于无线通信的多核并行处理器。......
编译器在提高程序运行速度和发挥处理器性能方面起着非常关键的作用,尤其在IA-64体系结构中,其性能的发挥在很大程序上依赖于相应......
描述了一款同时支持超长指令字(VLIW)与超标量(Superscalar)的混合处理器结构.该结构在一条流水线上,通过分发级(DDP)控制逻辑的灵活部署,支......
以X264编码器作为研究对象,在指令集并行的基础上对其进行线程级并行优化,在Intel双核处理器平台上,针对非实时编码应用得到近2倍的加......
IA-64是一种显式并行指令计算体系结构,支持全谓词执行,为发掘更多的指令级并行提供了新的途径和机会.谓词执行的目的是改变程序中......
寄存器结构及其分配是软件流水算法的关键之一 .为支持多重循环的软件流水 ,该文提出一种新颖的寄存器结构 :半共享跳跃式流水寄存......
软件流水是循环调度的重要方法,有分支循环的流水依然是个难题,现有算法可以分为4类:循环线性化、路径分离、整体调度和路径选择,它们......
软件流水是一种循环程序的优化技术,已经广泛应用于现代优化编译器中.为了充分利用VLIW DSP处理机的指令级并行性,必须使用软件流......
随着宽频互联网时代的到来,高端电子产品如4G智能手机、平板电脑在短时问内层出不穷,为了赶上时代的步伐,人们迫切地希望提升已有电子......
文章综述了指令级并行(ILP)微处理器的特点,着重介绍了第七代X86、Itanium、E2K等ILP微处理器的体系结构和所采用的新技术,分析了它们......
讨论了多媒体数据并行处理技术的结构和实现方法,并分析了DSP的指令级流水线结构,开发方法和实现技巧,同时在分析和重组数据流的基础......
指令调度通过调整指令之间的顺序来提高指令级并行度(ILP)。然而基本块通常很小,因而潜在的ILP也很小。随着芯片设计技术的发展,现代......
英特尔公司的超线程技术(Hyper-Threading Technology)是一项新的微处理器体系结构技术,它在传统指令级并行的基础上提供了线程级......
分子动力学数值模拟程序在现代高性能计算机上的计算效率往往很低,只能发挥系统峰值性能的几个百分点。本文对并行分子动力学程序PM......
作为64位处理器架构,IA64提供了更高的指令级并行性,代表了一种新型微处理器的发展方向。该文介绍了基于SLED对IA64指令的描述和利用......
BWDSP100是一款SIMD和VLIW架构高性能DSP,它的指令级并行性主要通过指令分簇和软件流水来实现。本文针对BWDSP100的特点,提出了一......
EPIC(Explicitly Parallel Instruction Computing)显式并行指令计算是当今高性能微处理器技术设计的新理念.本文分析了基于EPIC设......
本文以分组密码算法为研究对象,结合微处理器体系结构的特点,研究能够高效灵活实现多种分组密码算法的处理器体系结构。论文通过分析......
超长指令字处理器为了提高指令集并行(ILP)往往采用多个功能单元,从而需要多端口的寄存器文件提供支持.但是寄存器文件会随着端口的......
提出了一种超椭圆曲线密码处理器并行结构设计.处理器由多个具有相同结构的核组成,每个核由一个控制器、一个寄存器文件、一个运算单......
现代处理器已经开发出了很高的指令级并行技术,包括一系列的指令静态调度和指令动态调度的技术,同时采用动态分支预测和多发射等技......
多核同时多线程处理器(SMT_PAAG)是用于图形、图像及数字信号处理的一种多核处理器。基于这种处理器提出了一种硬件线程调度器,该调......
提出了一种基于分布式控制方式的动态指令调度算法,该算法能够有效提高指令发射效率,降低指令分派单元逻辑复杂度,提高系统主频.该指令......
H.264是最新的视频编码标准,具有非常优良的编码性能,但它的算法复杂度也很高,很难满足实时应用的需要。论文详细分析了影响H.264解码速......
嵌入式应用中,单指令流多数据流(SIMD,single instruction multiple data)结构的向量处理器在蓬勃发展的同时,也面临着如何高效利用其丰......