基于Power-gating的片上互连网络功耗优化研究

来源 :国防科技大学 | 被引量 : 1次 | 上传用户:hhkkpump
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着微处理器技术的发展,处理器计算核的数量不断增多,为核间提供高效的、可扩展的通信越来越重要。片上互连网络(Network-on-Chip,No C)相对于传统的总线互连结构,是一种弹性的、可扩展的多核通信解决方案,在现代高性能微处理器中得到广泛应用。随着处理器性能的不断提升,核的数量不断增加,片上网络规模和复杂度不断增加,使得片上网络的功耗不断上升,已成为制约片上网络发展的重要因素。如何降低片上网络的功耗,已成为国际上的热点研究方向。Power-gating技术通过动态关闭空闲的网络部件来降低片上网络的功耗,是片上网络功耗优化的一个热点研究方向。如何在关闭网络部件时保证网络连通性、如何避免频繁开关网络部件带来性能损失、如何对网络负载变化快速反应以保证网络性能等,都是Power-gating技术研究的难点。本文重点研究了面向片上网络的基于Power-gating技术的功耗优化问题,主要工作和创新概述如下:1.提出了采用异构虚通道的片上网络路由器功耗优化方法。传统片上网络的路由器中包含多个虚通道,每个虚通道都带有一定数量的缓存。缓存的作用是对报文进行暂时存储,从而减缓报文对路由器端口的竞争。基于缓存转发的路由器设计获得了较高的网络性能,然而,研究表明在功耗方面,路由器的缓存功率消耗较大。国际上最近的研究提出了无缓存路由器的设计,该设计在片上网络的路由器中不包含虚通道和缓存。这种设计极大降低了路由器的静态功耗,但由于无缓存带来的报文绕道或者报文丢弃重传情况,使得在网络负载流量较大时,无缓存路由器的性能很差。本文首次提出了采用异构虚通道的路由器设计HVC-Router,将路由器的虚通道设计为包含带缓存的和不带缓存的异构形式。相应的,本文提出了根据网络流量负载对虚通道,以及虚通道中的缓存进行动态开/关的算法。实验表明,HVC-Router在网络流量较低时,能有效地节省静态功耗。当网络流量增加时,能保证网络的性能不降低。2.提出了基于混合Mesh拓扑结构的低功耗多层片上网络设计。传统片上网络多采用单层网络结构。由于需要保证网络连通性,即使在网络负载很轻时,片上网络的很多部件也不能被关闭,从而较大的限制了Power-gating技术的应用,难以有效地降低功耗。国际上最新研究提出基于多层网络的低功耗片上网络设计Catnap,由于采用多层网络结构,在保证一层子网连通的情况下,可以对其它子网进行动态开关,实验表明,相对传统的单层网络可以有效降低功耗。但Catnap采用的是同构设计,即所有子网采用相同的Mesh拓扑结构。本文首次提出采用混合Mesh拓扑结构的多层异构片上网络设计HM-Mesh。HM-Mesh的第一层子网采用CMesh拓扑结构,其它层子网采用Mesh拓扑结构。CMesh拓扑结构在相同核数的情况下,因为网络规模比Mesh网络小,在低流量负载的情况下,功耗比Mesh网络低,而且由于报文的平均跳步数少于Mesh网络,报文延迟也较Mesh网络有优势。本文提出相应的Power-gating及流量分配算法,使得网络在低负载时,仅通过CMesh网络即可满足通信需求,而随着负载的升高,由Mesh网络来负载通信。3.提出了采用组合路由算法的低功耗多层片上网络设计。多核微处理器芯片采用关闭空闲计算核的策略来降低系统功耗。但由于要保证报文的可达性,与计算核相连的路由器不能被关闭,使得片上网络的功耗难以降低。本文首次提出将CBCG动态无规则拓扑路由算法用于片上网络低功耗优化中。CBCG是国际上面向片上网络路由器容错提出的路由算法。采用CBCG路由算法,使得可以更加激进的关闭片上网络中的路由器而不会引入报文不可达或死锁/活锁等问题,在网络负载较轻时,可以大大降低功耗。但如果单纯采用CBCG路由算法,在网络负载升高时,网络性能将急剧下降。因此,本文提出采用CBCG和维序路由算法同时工作的多层片上网络设计CRA结构。CRA根据网络流量变化,动态地开/关网络层,以及CBCG路由网络层的路由器,达到保证网络性能的前提下,节省更多的网络功耗。4.提出了采用多维度Power-gating技术的低功耗片上网络设计。当前国际上基于Power-gating的功耗优化技术,分别面向缓存、路由器、子网等不同的维度进行。本文首次提出结合多维度Power-gating技术的异构多层片上网络设计Chameleon,同时从多种维度对片上网络进行功耗优化。Chameleon采用异构的无缓存网络和有缓存网络相结合的设计方法,并采用了动态自适应细粒度Power-gating算法,对网络负载变化迅速响应。结合流量分配算法,实验表明,Chameleon取得了良好的功耗优势,且网络性能也得到了保证。
其他文献
六方氮化硼(h-BN)具有优异的综合性能以及特殊的二维结构,在众多高新技术领域具有十分广阔的应用前景。目前,h-BN材料的生长及制备工艺尚不成熟,现有的化学气相沉积(CVD)工艺温度高,腐蚀性强,工艺控制复杂,尚有很大的优化空间。本文以单组元氮化硼先驱体环硼氮烷为原料,采用化学气相沉积法,在石墨基底表面制备BN涂层,研究了沉积工艺对产物性能的影响,对CVD BN涂层的生长动力学进行了探究,分析模拟
强飞秒激光与原子、分子、凝聚态的相互作用蕴含着很多新的物理现象,是物理研究的前沿和重点。强场物理研究为人们探测和调控物质的超快动力学过程提供了强大的技术支持,具有重大的科学意义和应用价值。近年来,研究对象逐渐从原子分子向固体过渡。强激光场作用固体产生了极端非线性的电光学行为,实现了可以延伸到真空紫外和极远紫外区的固体高次谐波辐射,开启了固体强场物理研究的新时代。固体高次谐波不仅可以作为强阿秒脉冲源
分组密码是一类重要的对称密码。在众多评估分组密码安全性的分析方法中,不可能差分分析是一种非常有效的分析方法。本文以分组密码为研究对象,围绕不可能差分分析理论及应用展开研究。在结构不可能差分分析理论方面,首先,以已有的结构不可能差分理论为指导,针对基于LS设计理论的两个轻量级分组密码算法Fantomas和Robin,构造了比设计者给出的更长不可能差分。其次,针对两类特殊SPN结构,改进了结构不可能差
分数阶偏微分方程和随机分数阶偏微分方程理论已经被广泛应用到诸多工程和科学技术领域,能够更准确的描述复杂系统的演化规律。其理论分析和数值算法研究是一个核心热点问题。本文主要研究了带线性耗散项的分数阶非线性Schr?dinger方程和随机分数阶非线性Schr?dinger方程的解的适定性和数值算法构造及分析。论文共分七章,主要包括以下四部分内容:带线性耗散项的空间分数阶非线性Schr?dinger方程
拉丁超立方体设计在计算机试验设计,数值积分等领域中有广泛的研究和应用.本文围绕几类具体问题,研究了结构复杂的拉丁超立方体设计的理论与应用.主要工作与创新如下:1.构造了研究多精度试验问题的广义嵌套拉丁超立方体设计.针对普通嵌套拉丁超立方体设计存在的试验次数限制问题,提出了解决两精度试验问题的两层广义嵌套拉丁超立方体设计.该设计各精度试验次数灵活,可以很好地整合分析两精度试验.该类设计矩阵的抽样性质
阴极和收集极分别作为强流电子束起点和终点,对高功率微波源的性能具有重要影响。石墨是较好的爆炸发射阴极和强流电子束收集极材料,但其仍存在易释气、易造成系统碳污染等缺点,从而影响了石墨阴极和收集极在高功率微波源中的性能。目前,从材料角度改善石墨阴极和收集极性能的研究很少,对阴极表面材料成分和微观形影响其爆炸电子发射过程及性能的研究较少,对这一问题的认识仍然不够清晰。同时,高功率微波技术的发展对石墨阴极
聚合通信广泛应用于高性能计算的研究和工程领域,研究表明其在应用程序的科学计算时间中占据很大比例,某些应用程序的聚合通信时间可以占到整个通信时间70%以上,是高性能计算(HPC)系统的性能瓶颈。基于软件实现聚合通信操作的方法虽然有诸多优点,但已经不能满足日益增长的高性能计算应用的性能需求。而可编程网络硬件的出现,使得在网计算和在网缓存技术成为可能。通过将在网计算与缓存技术应用于异构并行智能计算的互连
学位
目前我国航天事业发展进入高速增长期,卫星发射相对密集,船舶执行任务日益频繁,常常近百天连续在海上航行,船舶内的通信设备一直处于长时间工作状态,为完成任务带来一定的风险,因此操作人员需要随时掌握设备运行状态。通信系统作为船舶执行海上任务及日常通信保障的重要组成部分,发挥着巨大的作用。但是,通信系统作为船内各类业务的中枢传输系统,具有业务种类多、信号类型杂、线缆分布广等特点,平时主要靠人员定期巡视或业
在船舶气象保障中,由于船舶处于海洋下垫面,其位置会不断变化,且移动范围相对较大,这与当前固定点的陆上台站气象保障形成鲜明对比。这种保障特点,要求预报员既要考虑大气运动发展,还有分析海洋动力情况,使得分析预报要素多、气象保障难度大。向上级汇报时,传统的二维显示方式信息量过于简单、且不够综合直观,已逐渐不能够满足气象保障辅助决策的功能需求。面对这些特点及难点,本文提出应用三维GIS系统,获得一个较好的