论文部分内容阅读
片上多核处理器以其效能高、设计周期短等优势成为高性能处理器设计的主流架构。相变存储器以其集成度高、漏电功耗低等优势受到多核处理器系统结构设计和研究的广泛关注。另一方面,制造工艺进入纳米尺度时代,以及新型工艺的引入,使得集成电路的可靠性设计面临着严峻的挑战。晶体管阈值电压降低导致软错误率不断上升,相变存储器的写次数受限降低了其生命周期可靠性,工艺偏差导致功能和存储部件的电气特性严重偏离预期值。更严重的是,上述可靠性问题的相互影响使得集成电路的可靠性设计变得异常复杂。本文研究在多种可靠性问题并存的情况下,多核处理器和相变存储器的容错设计方法,并取得了如下创新性研究成果:
1.提出了一种异地回滚、从核共享的多核处理器容软错误设计方法——SpeculativeNon-Stop,降低了时间冗余方法的性能开销和空间冗余方法的硬件开销。该方法通过基于症状的软错误检测机制减少冗余执行的指令数目,提出了本地猜测执行/异地回滚机制进行症状确认来降低时间冗余导致的性能开销,提出了从核共享机制来降低空间冗余导致的硬件开销。本文基于GEMS/SIMICS全系统模拟器搭建了实验平台,两个处理器核可共享一个校验核,并运行SPLASH2基准程序进行了实验评估。实验结果表明,与已有方法相比,此方法具有相近的性能开销,而软错误检测率平均提高了19%。
2.针对工艺偏差对核级双模冗余设计的影响,提出了考虑核间性能差异的任务调度算法。工艺偏差导致的核问性能差异在核级双模冗余平台上具有两种表现形式,核组间性能差异和核组内性能差异,并以不同的方式影响系统吞吐量。通过研究程序的行为特征,本文首先提出了程序对核组内性能差异敏感度的指标.AS2IV,并根据待分派任务数分两种情况进行了任务调度算法设计。当任务数与核组数目相等时使用IVF&AppSen算法,而当任务数小于核组数目时则采用模拟退火算法进行任务调度。最后,基于SESC全系统模拟器搭建了64核(32组)实验平台,并运行了SPEC2000基准程序进行算法效果评估。实验结果表明,与已有研究工作提出的算法相比,系统吞吐量提高了2.5%-9.3%。
3.针对工艺偏差导致的相变存储器生命周期偏差问题,提出了基于损耗率均衡的抗老化方法,可显著延长相变存储器的使用寿命。工艺偏差会使相变存储单元所需的最小编程电流不同而导致其生命周期偏差。通过分析程序的行为特征和存储器生命周期偏差的分布,本文提出了基于地址重映射和内存数据交换的损耗率均衡抗老化方法,并将该问题形式化为二部图的完美匹配问题。然后提出了最大超权重匹配算法(Max Hyper-weight Rematching),同时优化相变存储器的生命周期和内存数据交换量。最后使用存储跟踪工具HMTT在X86/Linux平台上采集SPEC2006基准程序的访存序列,并将此作为最大超权重匹配算法的输入,对容量为2GB的相变存储器进行抗老化设计。实验结果表明,与已有写均衡算法相比,相变存储器的生命周期平均延长了19倍,数据交换量平均降低了68%。