论文部分内容阅读
随着大规模集成电路技术的发展,可用的片上资源越来越多,如何把丰富的晶体管资源转化为实际的计算能力,是当前体系结构研究中面临的基本问题。传统的超标量和超长指令字结构,由于采用集中式、全局控制结构以及广播式数据通路,导致功耗、线延迟和设计复杂度等诸多问题,很难进一步扩展,因此一种结构模块化、分布化、层次化的分片式处理器体系结构应运而生。分片式处理器通过资源分布和资源复制策略代替传统集中式控制结构,用点到点片上数据传输网络取代广播式数据通路,可扩展性大大增强。但在顺序执行模型下,受编译技术和应用本身的限制,很难充分发掘应用的指令级并行性。因此,我们提出分片式处理器上基于指令块的激进执行模型。本文针对影响分片式处理器激进执行模型有效性的几个方面进行了分析和实验验证,为激进执行模型的实践提供了理论指导。本文采用理论分析和实验验证相结合的方法,一方面在理论上分析了各种因素对于分片式处理器激进执行模型的影响,另一方面对这些影响因素建立有效的实验评价方案和实验环境,进行实验验证。本文的研究内容和成果包括以下几个方面:(1)从控制流的角度,分析了控制相关对于激进执行模型的影响,提出了块级预测技术,设计了一种基于传统分支预测器的块级分支预测器;并且针对块间的控制相关,提出了自己的实验评价方案,评价了控制相关对于分片式处理器上激进执行模型有效性的影响。实验结果表明,由于块级预测具有较高的预测精度,适合深度推测,因而控制相关对于激进执行模型有效性影响较小。(2)从数据流的角度,分析了数据相关对于激进执行模型的影响,提出了块间的数据forwarding和值预测技术,并给出了块间数据依赖深度概念。实验表明大部分应用都具有较高的依赖深度,并且可以通过数据流推测技术进一步减少数据相关造成的等待时延,因而数据相关对于分片式处理器激进执行模型有效性影响较小。(3)针对结构相关对于激进执行模型的影响,分别对各种可能的结构相关因素;进行了分析和实验。结果表明,结构相关对于分片式处理器激进执行模型几乎没有影响,并且有利于把更多的片上资源转转化为芯片的计算能力。本文的实验结果表明,在分片式处理器上引入激进执行模型是完全可行的,可以通过控制流推测、数据流推测等技术克服块间的控制、数据相关,进一步扩大分片式处理器的指令发射窗口,发掘应用的指令级并行性。