【摘 要】
:
近年来,随着大数据的发展,GPU应用的数据集规模急剧增加,这对GPU的处理能力提出了挑战。由于摩尔定律即将达到极限,提升单一GPU的性能变得越发困难,而多GPU系统通过提升GPU处理器级的并行性,成为应对该挑战的一种解决方案。GPU制造商对内存虚拟化的支持进一步简化了多GPU系统的编程,提升了资源利用率。内存虚拟化需要地址转换的支持,现阶段的研究表明,地址转换请求若未在TLB命中,会引起页漫游导致
论文部分内容阅读
近年来,随着大数据的发展,GPU应用的数据集规模急剧增加,这对GPU的处理能力提出了挑战。由于摩尔定律即将达到极限,提升单一GPU的性能变得越发困难,而多GPU系统通过提升GPU处理器级的并行性,成为应对该挑战的一种解决方案。GPU制造商对内存虚拟化的支持进一步简化了多GPU系统的编程,提升了资源利用率。内存虚拟化需要地址转换的支持,现阶段的研究表明,地址转换请求若未在TLB命中,会引起页漫游导致多个线程暂停,破坏GPU的线程级并行性,对GPU系统性能具有重要影响。因此本文将研究点放在多GPU系统的虚实地址转换架构上,主要工作有如下三点:·多GPU系统虚实地址转换架构分析:本文结合单GPU虚实地址转换架构,将多GPU系统虚实地址转换架构归纳为分布式地址转换架构与集中式地址转换架构,并且对二者进行了深入的分析。通过对两种地址转换架构的分析本文发现:分布式地址转换架构的性能普遍高于集中式地址转换架构,适用于数据集中访问本地数据较多的应用程序;集中式地址转换架构有着更低的硬件开销,适用于数据集中访问共享数据较多的应用程序。·动态旁路GMMU机制:本文通过对多GPU系统虚实地址转换架构的分析,发现两种地址转换架构都有性能下降的特定情况。为解决此问题,本文提出了动态旁路GMMU机制:GMMU Bypass,该机制允许地址转换请求动态地旁路GMMU,以减少转换开销。实验结果表明,GMMU Bypass性能平均比分布式地址转换架构高出6%,比集中式地址转换架构平均高出106%。·阈值自适应GMMU Bypass:研究表明,各激励在不同阈值的GMMU Bypass下性能有所差异,进一步分析发现,性能差异与IOMMU的拥塞情况相关。因此本文提出阈值自适应GMMU Bypass,根据IOMMU的拥塞情况调整GMMU Bypass的阈值,以提升多GPU系统虚实地址转换效率。仿真结果表明,阈值自适应GMMU Bypass的性能比分布式地址转换架构高出12%,与GMMU Bypass相比提升了6%,达到理想情况的99.2%。
其他文献
习主席指出,士官队伍是部队中非常基础的骨干力量,这个队伍的稳定性很重要。近年来,随着军队规模结构和力量编成改革的深入推进,军队院校已完成体系重塑和集优整合,军队士官学校作为专门培养士官人才的军事院校,面对新的使命任务,如何科学有效的开展教学质量评价,从而提升人才培养质量,是每所士官学校必须面临的问题。学校为学员而设,教员为学员而教,以学员为中心,让教学适应学员,是院校首先应确定的原则。因此,“以学
随着网络技术的飞速发展,网络安全变得越来越重要,黑客、病毒和网络攻击的隐患也很多。Web应用防火墙可以在有效保护信息安全的同时,将外部攻击的影响降到最低。此外,正则匹配算法也得到了广泛的应用。使用常规匹配规则库的传统防火墙存在明显的不足。例如,他们只能做“事后辩护”。随着计算机技术的发展,全智能识别时代正在来临。作为人工智能技术的重要组成部分——支持向量机(SVM)在图像分类和文本分类方面有着天然
图像传感器作为重要的光电器件,广泛应用于红外探测,自动驾驶,智能手机,人脸识别,机器视觉等各个领域。随着人们对图像采集质量和响应需求的不断变化,对图像传感器的帧率、动态范围、分辨率等指标要求也不断变化,图像传感器的市场也随之迅猛发展,对图像传感器的研发速度提出了更高的要求。频率综合器作为时钟发生器,是图像传感器中必不可少的重要组成模块,为整颗芯片提供必要的时钟信号。频率综合器的好坏将决定图像传感器
退役军人安置工作,能够有效保证军队的战斗能力,维护国家的政权。对怀化市退役军人安置工作的研究,目的是以小见大,分析解决地方政府在退役军人安置的过程中所碰到的现实困难,也为促进新颁布的《退役军人保障法》等相关制度的完善,推动政策的有效落实提供理论支持。文章界定了退役军人安置的相关概念,分析了目前我国针对的退役军人的主要安置方式,运用新公共管理理论、社会保障理论以及文献法、调研法、案例分析法等方法,研
城市进程的加快导致了夜间光污染问题的出现,灯光监测纳入智慧城市环境治理体系。既有光环境研究多集中在空间维度上表达灯光分布特征,缺乏时间和空间双重维度的灯光演变特征研究,而数字化及机器学习等工具的成熟,为光环境时空分布与精准动态监控研究提供了理论和技术支撑。因此本文以大连市光环境为研究对象,将预测概念引入城市灯光监测系统中。使用长时间序列遥感影像、多参数地面实测数据研究大连市灯光时空演变特征;通过误
随着社会经济的不断发展,人们的生活水平和收入不断提高,使得文旅经济也在蓬勃发展。山东省青岛市自然资源和人文资源丰富,文旅产业潜力巨大,但是由于国内外市场经济发展逐步放缓、国内旅游市场的竞争愈加激烈和青岛文旅产业本身发展存在的问题,导致青岛整体文旅产业处于瓶颈期,突破瓶颈状态的重点在于文化资源的重新整合和文旅品牌的重新塑造,打造全新的文旅产业竞争优势,实现品牌价值的再提升。本论文在文旅融合的视角下对
近年来,数据中心的数量和规模越来越大,导致数据中心的能耗大幅增长,这会造成一系列经济和环境问题。IT设备能耗是数据中心的主要能耗之一,其中服务器能耗占比最高,因此降低服务器能耗有助于数据中心节能。对服务器进行能耗预测,可以辅助数据中心基于能耗实施调度策略,降低数据中心能耗。本文从时间序列分析的角度出发,对数据中心能耗预测问题进行了深入研究,提高了预测模型的精度。本文将服务器的能耗预测问题转化时间序
新型冠状病毒肺炎疫情爆发后(以下简称为新冠肺炎疫情或疫情),深刻影响着大学生的思想情感、生活方式。危机中孕育着新机,党中央带领全国人民同心抗疫的伟大实践极大充实了大学生思想政治教育工作的内容,凸显出深刻的导向价值、教育价值和激励价值。习近平总书记强调,新时代高校思想政治工作必须与时俱进,不断创新工作方法,增强高校思想政治工作的时代感和吸引力,提高思想政治教育针对性和亲和力。只有结合抗击新冠肺炎疫情
近年来,云计算技术的发展十分迅猛,按需支付的商业模式和个性化的计算需求使得工作流调度中的现有的计算资源规划面临巨大的挑战。因此,研究人员致力于引入元启发式调度算法去缓解资源利用率差的现象,大多数研究人员主要关注任务的负载均衡,以达到产生更加高效的计算资源利用的目标。然而,这种仅关注一种目标的情况将增加具有较大规模的任务的执行时间,从而导致其调度效率低下。目前市面上的大多数调度算法也是仅关注一种目标
近年来,针对硬件的攻击如冷启动攻击这类针对嵌入式计算设备中内存的攻击不断出现,严重威胁嵌入式计算设备的安全。在这类攻击中,攻击者利用特殊工具对嵌入式计算设备的内存进行物理访问,就能获取到内存中的秘密数据。为此,本文提出一种基于物理不可克隆函数(PUF)的安全存储结构。该结构利用PUF为加密算法生成安全密钥,并针对嵌入式微处理器具体应用进行结构优化,从而使嵌入式微处理器能够抵抗多种针对内存的物理攻击