高通量处理器的调度机制研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:liuweiljfs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在高通量众核处理器执行任务过程中,众核处理器共享资源有限而资源消费者众多,这给处理器的调度策略带来挑战。高通量众核处理器属于并行体系结构,其核心部件资源为处理器核、存储层次和互连网络三部分。调度需求广泛存在于高通量众核处理器核心部件的共享资源中,对于高通量众核处理器来说,如何有效地分配调度有限的共享资源是一个重要的问题。  首先,高通量单程序多数据(SPMD)模式应用的执行过程将任务以线程的形式分布在众核处理器的每个核内并行执行,为了尽可能的增加处理器的利用率和吞吐量,每个核内安排了多个线程的计算任务。在处理器核内,针对有限的核内资源,调度机制为这些核内线程调配资源,对处理器核的总体吞吐量和性能有决定性的意义。其次、在存储端,线程之间对于共享存储资源的争夺将进一步影响等待访存结果的处理器核的性能。对于并行处理的高通量应用程序来说,公平的访存调度策略可以在多个线程间平均分配资源,有效缓解线程对共享存储资源的争夺带来的负面影响。另外,随着众核规模的增加,片上网络的拥塞显著提升,因此通过路由算法和拥塞调度策略来控制拥塞也必不可少。  综上所述,在高通量众核处理器资源消费者众多,而共享资源有限的前提下,调度策略的重要性和必要性都不言而喻。从高通量处理器的结构以及高通量SPMD应用的执行流程上来看,高通量众核处理器主要存在着处理器核内多线程,存储资源公平性访问,以及片上网络的拥塞控制等三方面的调度需求。  针对上面提到的三方面需求,结合近年来在国内外在众核处理器共享资源调度设计方面的经验,本文在核内同时多线程模式,共享存储资源的公平性访问模式,片上网络拥塞控制模式等方面对高通量处理器进行了设计优化。  本文的主要创新点及贡献包括:  DTI:双路交替同时多线程调度机制。通过结合同时多线程和粗粒度多线程的优势,DTI将每两个线程配成一对,线程对之间采用同时多线程机制调度,线程对内采用粗粒度多线程的调度方式,来提高资源利用率,隐藏SPMD模式的高通量应用的集中访存延迟。实验结果表明,面向高通量SPMD应用wordcount,grep和kmeans,在核内8线程条件下,双路交替同时多线线程调度比传统的ICOUNT和DCRA多获得35%的性能和44%的使用率的提升;  LFF:一种面向高通量应用的众核处理器公平性访存调度机制。针对SPMD模式的高通量应用并行线程行为相似的特征,本文将执行线程的公平性调度转化为访存公平性调度,提出了一种根据节点位置和访存历史信息的访存公平性调度方法:最少最远优先访存调度(LFF)。在LFF策略下,首先根据节点访存请求次数进行调度,次数少的优先访存,若次数相同,较远距离的节点具有更高的访存优先级。 LFF提高了处理器中线程的公平性,进而提升了高通量应用的整体性能;通过实验评估,本文提出的调度机制的公平性调度效果优于FR-FCFS,PAR-BS和ATLAS。在1024核情况下,系统异步率由FR-FCFS的15.5%降低到1.89%。  GHARA:全局层级化自适应路由机制。通过分级监控区域内不同方向的拥塞信息,建立全局拥塞感知网络,指导众核结构中的路由策略,减少拥塞,降低网络延迟;实验结果表明GHARA表现优于其他区域和全局自适应路由算法。在人工注入通信模式下,8×8 Mesh平均饱和带宽比全局自适应算法GCA提高10.7%,16×16 Mesh平均饱和带宽比全局自适应算法GCA提高14.7%。在运行真实测试程序集splash-2模式下,数据包延迟最高比GCA降低40%,平均降低14%。
其他文献
该文论述我们自行研究开发的一个并行数据仓库系统PARAWARE的核心技术--多维数据的存储、查询和维护的理论研究和系统实现.该文共分四个部分.第一部分介绍了数据仓库和联机分
上世纪80年代提出的人机交互技术着重强调了以人为中心的计算和人体工程学。近些年来,随着智能设备的普及和视频游戏用户的不断增长,人机交互已经被应用于我们生活的方方面面。
IPSec(IP SECURITY)是近年来发展起来的一种网络安全标准,它在网络层针对IP包进行加密和认证,以保证数据的保密性和完整性。本文从网络安全问题开始,首先简单介绍了IPSec协议体
社交网络的开放性和互联性,造成了社交网络中信息来源广泛,更新速度快。在海量的社交消息中,最终只有一小部分会引起人们的兴趣和关注,最终流行或爆发,造成巨大的社会影响,甚至引导
地球表面积的71%是海洋,我国拥有299.7万平方公里的海洋国土。从安全需求上来看,要监控恐怖袭击、海盗、走私、偷渡等违法活动,发现违法侦测、资源侵占等行为,为国土安全提供屏障
最近几年,神经网络的应用越来越广泛,在图像、语音、机器翻译等领域都取得了卓越的成绩。为了提升神经网络的效果,神经网络的规模逐年递增,结构日益复杂。这导致神经网络的计算量
随着计算机网络技术的高速发展和网络应用的不断普及,人们萌发了随时随地访问因特网并获得满意的多媒体服务的强烈愿望,这已成为通信服务提供者和使用者的理想目标.无线移动
在远程教育大力推广的今天,虚拟实验已被广泛应用于远程教育实验教学系统中.由于计算机程序执行的动态效果和计算机硬件的时序变化关系较难仿真,从而很难反映出硬件实验现象
本论文在介绍了“NTN”校准技术背景的基础上,详细阐述了“NTN”校准技术的原理、实现过程及优势。本文的主要研究内容是用PSPICE软件对“NTN”校准技术的关键理论、方法进行
七号信令网是通信网的神经中枢,在电话网、移动网、智能网等通信网中已成为不可缺少的一部分,其畅通与否直接关系到整个电信网的通信质量,这就需要一套监测系统对七号信令全网进