多核架构下LLC很少重用块的研究

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:ilfang456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多核Cache中共享最后一级Cache(Last Level Cache,LLC)已经是一个研究热点。多核体系结构中LLC通常为共享L2 Cache,当被访问的数据块不在L2 Cache中时,将会发生L2缺失,CPU需要花费上百个周期访问主存,其代价是无法忍受的。在LLC替换算法(replacement algorithm)中,LRU替换策略被广泛地应用于芯片多处理器中。基于以前的研究,LRU替换策略仍然存在着一些不足,特别是在当应用程序的工作量大于L2 Cache大小时,LRU替换策略可能表现出相当差的性能,这是因为在L2 Cache中存在着大量的从来没有被访问或者访问次数很少的块。如果我们保留经常访问的块在L2 Cache中,那么L2 Cache的性能将会大大提高。本文中提出一种新的称之为共享很少重用过滤器架构,多核情况下,该共享很少重用过滤器可以过滤出未被访问或者访问次数很少的块,将经常访问的块保留在L2 Cache中,可以保证Cache空间被有效的利用,同时命中率也会提高。共享很少重用过滤器主要由3部分组成:过滤缓冲器,阴影标签和频率预测器。过滤缓冲器主要作用是用来过滤很少重用块以及修改频率预测器错误的预测。为了给Cache块一次命中机会,把这个Cache块放入到过滤缓冲器中,当它下次被访问时就变成了经常访问的块并把它插入到L2 Cache。阴影标签主要作用是当过滤缓冲器替换出一个块时,这个块的标签和重用信息被记录到阴影标签中。频率预测器是用来记录L2 Cache中没有出现的块的最近重用频率。当Cache块发生缺失时,频率预测器将根据缺失块的重用频率历史来预测其重用频率值。本文的实验基于11个多线程测试程序:splash-2测试程序。通过修改多核模拟器代码实现了共享很少重用过滤器,实验表明,对于2M LRU管理的且拥有一个256K大小的共享重用过滤器的L2 Cache,与单核情况相比较其IPC可以平均提高13.43%,MPKI可以平均减少18.20%。
其他文献
多分类器集成,也称多分器组合或多分类器联合,近年来,多分类器融合技术在人脸识别、手写字符识别、遥感图像分类等方向上受到了广泛重视,显示出很大的研究价值和现实应用前景
随着互联网视频数据的快速增长和相关新型应用的涌现,视频的高效压缩和传输成为学术界和产业界深入研究的热点问题。   本文提出了一种新的视频编码和传输框架,该框架应用多
H.264视频压缩编码标准凭借着编码质量高,低码率,网络亲和性等特点在CMMB(China Mobile Multimedia Broadcasting)手机电视中获得应用,但手机的处理能力低,H.264解码的计算复
巷道作为矿山项目中重要的空间要素,它在数字矿山系统中占有十分重要的位置。由于巷道在地下纵横交错,单纯用二维图形很难直观的表达出地下巷道几何形态和所处的空间位置,因
脱机手写数字识别是一个至今仍没有完美解决的问题,是一个很有挑战的问题。它有着广泛而重要的应用需求,如识别邮政编码、银行收据、税收票据、各种打印手写的数字等等,这吸
随着电信行业的飞速发展,除了电信的传统业务如宽带业务外,电信获得了3G牌照以后,企业获得了又一次的飞跃发展的机会,而带来这次发展的契机就是电信的移动业务,进入了3G时代,
随着计算机硬件的发展以及人工智能理论的不断完善,越来越多的简单重复性脑力劳动开始被计算机所取代,不仅极大地提高了效率,而且将人们从枯燥单调的脑力劳动中解放出来。针
随着无线传感器网络的应用越来越广泛,聚类算法被应用于此平台。聚类算法是数据挖掘和机器学习领域的一个重要的分支。无线传感器网络上的数据聚类可以应用于检测温度变化、
随着计算机信息技术和互联网的不断发展,以数字化技术为主的嵌入式产品正在广泛的应用于工业自动化、移动通讯、医疗仪器和家用电器等各个方面。嵌入式开发已经成为当今信息
第三方组件的广泛使用给软件开发带来很大方便的同时,其源代码不可知性也给软件工程带来一定的挑战。组件软件系统的某些功能是通过不同组件之间的相互协调、调用和通信来完