论文部分内容阅读
大数据时代的来临加剧了本就已很严重的存储墙、带宽墙以及功率墙问题,也使得当前的计算机系统在处理相关的数据密集型应用时,存储系统往往会成为整个系统的性能瓶颈。近年来一些针对性的存储优化技术以及新型存储结构、介质等为存储结构的发展提供了可能性。本文面向存储结构中真实存在的各种问题,围绕从各方面对存储结构进行优化来展开,基于不同存储结构的优势与不足,针对性的设计优化框架来提高存储系统的性能;通过合理的利用新型存储结构的存储内计算特性,以全新的视角探究将存储系统作为加速器的可能性。在目前通用存储系统以及新型存储结构的框架下,本文重点解决三个问题:如何在当前多级复杂存储结构的框架下充分挖掘预取技术的潜力;如何在目前DRAM可扩展性已经乏力且新型存储结构存储容量并无很大提高的情况下,通过压缩技术增大其有效容量;如何合理的利用当前新型三维存储结构的逻辑层进行存储内计算,针对某类重要应用进行加速。本文取得的主要研究成果如下:1.提出了一种面向多层存储结构的优化预取效率方法CHAM(Composite Hierarchy-Aware Method for improving Prefetch Efficiency)。硬件预取一直以来都是提升系统性能的重要方法。然而硬件预取的效率在很大程度上取决于预取的准确率,若准确率较低的话,预取器可能会降低系统的性能。之前有工作提出在两层Cache结构上进行自适应性预取的方法,这种方法在两层Cache结构上可以提升系统性能,而在更为复杂的存储系统中,例如三层的Cache结构,所取得的性能加速就比较有限。CHAM部署在存储系统中的中层Cache中,使用运行时的预取准确率作为评估参数。CHAM中包括两个工作:1)一种动态自适应的预取控制机制,用于在实时针对预取指令调度的优先级以及预取数据的传输层次进行调度。2)一种以提高预取率为目的的混合型Cache替换策略。2.提出了一种提升三维存储结构容量的压缩管理机制CMH(Compression Management in the Hybrid Memory Cube)。由于受到DRAM位元可扩展性以及功耗密度的影响,单个HMC的物理存储容量很有限,而且并不太可能在未来有明显的增长。因此,在应对大数据时代的高性能应用程序时,HMC的存储容量受限将是一个非常严重的问题。针对新型存储系统容量提升不高且后继乏力的情况,提出了一个用于增长HMC有效存储容量的压缩管理机制CMH。CMH部署在HMC的逻辑层,通过在数据传输的过程中压缩数据以及在运行时对HMC中DRAM层存储的数据进行选择性的压缩。CMH可以有效的提高存储容量,同时也节省了运行时所消耗的带宽。3.提出了使用混合存储块(HMC,Hybrid Memory Cube)进行加速的方法,HMCSP(CSR-based SPMV in HMC)与CGAcc(CSR-based Graph Traversal Accelerator on HMC)。HMC作为一种新型的三维存储结构,其在有计算功能的逻辑层上堆叠负责存储数据的DRAM层。得益于HMC独特的存储内计算(PIM)特性以及非常短的传输延迟,将HMC作为加速器优化一些常用的应用程序是一种很有前景的研究点。HMCSP是一种利用HMC逻辑层的PIM部件来降低传输延迟,提高性能的方法;CGAcc利用存储内预取器,基于HMC的三维结构,部署在其逻辑层上以利用其PIM部件以及很短的传输延迟,并通过将预取流水线化来提高存储层次的并行,进而对程序进行优化。对存储系统的优化一直以来都是研究的热点,然而由于现在存储技术的飞速发展,对存储的优化仍有相当大的空间。本文以当前通用的处理器存储架构,以及一些新型的存储架构为研究基础,提出并设计实现了若干针对目前存储系统中的性能、容量等问题的优化技术及框架。本文的所有工作都经过了大量实验的验证,结果也表明对于存储系统的优化是实际有效的,能够应用于未来存储系统的设计与实现。