HPP体系结构下基于TLB的访存性能优化

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:objzobjz3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
访存性能是影响高性能计算机性能的重要因素之一,提高访存性能对提高应用性能具有重要作用。超并行(Hyper Parallel Processing,HPP)体系结构是国家智能计算机研究开发中心提出的一种面向千万亿次计算的超级计算机体系结构,它从硬件层面上支持全局物理地址空间的特性给访存带来了更大挑战。   本文研究HPP体系结构下基于TLB的访存性能优化技术。大页面技术能够有效提高HPP系统访存性能,应用大页面后TLB中出现的大页面TLB表项和小页面TLB表项并存的局面可能会导致潜在的不必要TLB替换。本文提出一种动态分区TLB技术,能消除潜在的不必要TLB替换,降低系统的TLB缺失率,从而提高系统访存性能。   本文主要工作和贡献有:   (1)提出了一种动态分区TLB技术。替换大页面TLB表项的代价高于替换小页面TLB表项。通过研究大页面和小页面并存环境下大页面TLB表项和小页面TLB表项的相互影响,针对在缺省的TLB替换算法下大页面TLB表项可能被小页面TLB表项替换使得性能下降的情况,本文提出的动态分区TLB技术将TLB按照页面大小进行分区,以避免大页面TLB表项被小页面TLB表项替换,有效降低了系统TLB缺失率。   (2)模拟并分析了TLB的动态分区策略。本文实现了一个TLB模拟系统,能针对各种访存类型的应用进行TLB缺失率的评测。对于访存密集型应用,TLB缺失率与TLB分区点位置紧密相关,对此提出了基于空间的动态分区策略和基于热度的动态分区策略,动态管理TLB分区点位置,保证尽可能低的TLB缺失率。   (3)实现了曙光6000计算节点的内存管理子系统,并对其进行了分析和评测。该系统不但支持大页面和对大页面的透明访问,并且采用动态分区TLB技术来实现TLB管理。评测结果表明,相对于没有采用动态分区TLB技术的测试,在动态分区TLB技术支持下测试应用的TLB缺失率降低了1%到10%,性能提高了1%到8%。  
其他文献
分区机制是满足航空电子系统的综合化模块化发展要求不可缺少的技术,在基于ANRIC653的综合模块化航空电子系统(IMA)中,分区是调度和资源分配的核心单元,系统使用分区分层的体系
行人/自行车/机动车混行的交通特性是我国城市交叉路口最显著的交通特点之一,深入研究交叉路口移动目标的交通行为对于缓解交叉口拥堵,提高交通效率等方面具有重要意义。但是
随着电子化不断发展,越来越多政府工作都由手工升级为电脑自动处理,电子政务应运而生。电子政务已成为政府工作自动化和智能化的重要手段,电子政务应用软件反映了政府工作效
随着网络规模的扩大、节点种类的增长以及网络中支持的应用与服务的多样性的提高,网络环境的复杂性迅速增加。网络协议与应用的开发中不得不考虑越来越多应用无关的底层细节,
随着网络技术的飞速发展,与互联网有关的安全事件与日俱增。近年来网页木马已成为恶意代码最常见的传播方式之一。部分黑客利用网页木马入侵因特网客户端主机,窃取虚拟财产和
人工植物优化算法是一种新颖的群智能寻优算法,它通过模拟植物生长的过程,建立了具有光合作用算子、向光性算子及顶端优势算子的人工植物算法框架,但由于该算法的局部搜索能
“离线下载”是近两年来伴随云计算技术出现的一种新型的互联网资源分发方式。它基于云平台提供广域网的、智能的代理下载服务,因此也被称为“云下载”。在该系统中,用户向系
信息隐藏技术作为保护机密信息的一种新手段,越来越受到人们的重视,得到广泛的应用与研究。将标识产品的数字序列、文字、图像等信息隐藏于产品中,这就是数字水印技术,它是信
网络恐怖信息过滤的研究不仅能够促进网络内容安全和人类情感认知等相关领域研究的发展,而且对构建和谐网络环境,维护社会稳定具有重要的社会意义。本文针对恐怖视频展开研究
随着终端数量和流量需求的提高,无线局域网(WLAN,Wireless Local Aera Network)中单位空间设备和流量密度越来越高,高密场景吞吐量瓶颈越来越突出。IEEE802.11协议中的增强分布