论文部分内容阅读
随着微处理器设计进入多核及众核时代,核间通信成为处理器性能提升瓶颈。片上网络有效解决了这一问题,成为目前片上多核互连的主流通信架构。芯片制造工艺的不断进步造成芯片规模急剧增大,片上故障发生率越来越高,片上网络可靠性研究成为片上网络相关研究的重要方面。容错能力是评价片上网络可靠性的重要指标,成为近年来学术界研究的热点,而针对这方面的研究仍然存在许多不足。容错路由器和容错路由算法是片上网络容错体系中的重要组成部分,本课题以这两方面内容为研究主线,开展对基于2D-Mesh互连的片上网络路由器FIFO容错、虚通道动态分配式路由器端口容错和自适应容错路由算法的研究,主要工作和研究成果体现在以下三个方面:1、提出了一种面向片上网络路由器FIFO故障的在线检测和容错设计方案。在建立路由器FIFO功能模型和故障模型的基础上,设计了一种针对路由器FIFO故障的在线测试算法,在系统实时运行过程中完成对FIFO的故障测试,并通过理论分析证明了算法的高覆盖率。然后,设计了FIFO故障测试算法硬件实现架构,并提出了相应的容错机制,构成了一套完备的FIFO故障容错体系。仿真实验表明,在FIFO存在故障的条件下,该方案能有效完成对路由器FIFO的容错,并且通过对测试参数的合理设置,当数据包注入率达到一定值时,该方案能有效提高片上网络的性能。综合结果表明,该方案的硬件开销较基准虫孔路由器增加约12%。2、提出了一种基于端口故障粒度划分的虚通道动态分配式容错路由器设计方案。根据端口故障发生特点,对端口故障进行粒度划分,并分析虚通道动态分配方式特点,采用排队论理论,建立了一种粒度划分的端口故障与拥塞预测模型。然后,设计了故障实时检测模块用于诊断故障,设计了邻端口共享模块用于容忍端口粗粒度故障,设计了虚通道容错控制逻辑用于容忍端口细粒度故障,并提出相应的容错与拥塞缓解方案。仿真结果表明,提出的端口容错设计方案在各种故障模式下都有着较好的容错能力。综合结果表明,本文提出的端口容错路由器具有较好的性能提升与面积开销比。3、提出了一种片上网络拥堵感知的自适应容错路由算法。分析了目前容错路由算法处理复杂故障和拥堵状况能力的不足之处,建立了一种新颖的节点邻32链路故障实时感知机制,并扩展了路由器延迟模型,提出了一种新的拥塞感知机制。然后,对故障处理和拥塞处理划分优先级,以逻辑电路形式设计了故障处理模块,并构建了高效的拥堵处理模块,提出死锁及活锁避免方法,构建了一套完备的自适应容错路由算法。仿真实验表明,该算法在复杂故障模式下有着较好的容错和拥堵避免能力。综合结果表明,算法的硬件开销较基准虫孔路由器增加约29%,有较好的性能提高与面积开销比。