【摘 要】
:
多核架构已经广泛地应用在产业界,尤其在个人电脑、智能手机和多数对性能要求较高的设备上,多核架构具有巨大的性能优势。然而,随着多核架构在性能上的爆炸性增长,多核架构的
论文部分内容阅读
多核架构已经广泛地应用在产业界,尤其在个人电脑、智能手机和多数对性能要求较高的设备上,多核架构具有巨大的性能优势。然而,随着多核架构在性能上的爆炸性增长,多核架构的劣势也逐渐地显现出来,例如能耗问题,具体体现在智能手机续航能力差、大型数据中心中电量成本开销增加等问题上。于是,研究人员提出一种全新的架构——异构多核架构(AMC,Asymmetric Multi-Core)。在异构多核架构中,不同的CPU具有不同的性能表现和能耗。当一台计算机整合了多个CPU时,通常用采用非一致性内存访问(NUMA,Non-Uniform Memory Access)结构组织内存。由于异构多核芯片良好的性能表现和高效的能耗,基于NUMA内存系统的异构多核架构才得以在大规模数据中心和智能手机等设备上得到应用。但是,由于负载不均衡、低下的共享cache命中率和NUMA内存节点间远程内存访问等问题,现有的并行程序的任务调度策略往往在异构多核架构上表现不佳。为了解决这个问题,我们提出了一个非对称感知的可选择任务窃取机制(SAWS,Selective Asymmetry-aware Work-Stealing),它能够在保证能耗不变的前提下,通过平衡各个CPU间核的负载来减少远程内存访问,实现核间负载均衡最大化的同时,提升整体的运算性能。本文的主要工作是面向异构多核架构,提出了一套AMC架构非对称特性的分析、任务分配和动态调度的机制。非对称感知可选择任务窃取机制,是基于MIT Cilk运行时系统实现的;SAWS由一个非对称感知任务分配器和一个可选择任务窃取调度器组成。非对称感知任务分配器会在并行程序编译期间,完成程序的静态分析和添加运行时系统所需的控制代码。随后在并行程序执行的过程中,在每一轮迭代开始之前,任务分配器可以有效地将任务分配到合适异构CPU中,使得大多数任务在执行的过程中,尽可能地通过本地内存节点访问数据,根据CPU的计算性能差异进行负载均衡。同时,可选择任务窃取调度器利用核的电能余量,通过调度的方式进一步地调整核间负载以及选择性地调节核的频率。实验评估是在真实的异构多核机器上进行的。在实际的异构多核架构中,我们的实验结果表明,相比于传统的任务窃取调度器,SAWS在不增加能耗的条件下,在异构多核架构中能有效地提升内存敏感(Memory-bound)程序的计算性能,运行时间最多可减少59.3%。由可扩展性实验结果也可看出,SAWS还具备良好的可扩展特性。
其他文献
对外汉语教学中关于“语”“文”教学研究向来已久,也就是汉语教学中语音与汉字、口语与书面语之间的先后顺序、协调抗衡的问题,对此,不同专家学者持有不同看法和意见,至今尚无定论。对外汉字教学在走上坡路的同时,仍面临方方面面的挑战,是对外汉语教学中的研究重点与难点。本文结合韩国CPIK项目在韩实施情况,调查总结韩国汉语教学中有关“语”“文”教学的问题、探讨分析其原因,并结合笔者在韩教学经验给出适当建议。首
实时系统在国防、金融、电信、航空等重要应用领域中发挥了至关重要的作用,近年来实时系统大量用于我们的日常与工业生产。实时系统不仅要保证逻辑正确性,还要保证时间正确性
"多规合一"实质是政府简政放权改革。本文分析了厦门利用多规合一推进建设项目审批制度改革面临的困境,提出深化建设项目审批制度改革的必要性与可行性,充分借鉴新加坡的先进
信号调制方式的自动识别是检测到信号之后,进行信号解调之前的一个重要步骤,在民用和军用通信领域均发挥着举足轻重的作用。结合国内外文献资料,类间信号调制分类已经取得了不错的效果,但高阶信号的类内分类还存在一系列问题。传统的对高阶信号进行类内分类的方法主要是采取高阶累积量的方法,因为高阶累积量可以非常有效地抑制高斯噪声的影响。然而,传统的高阶累积量方法存在以下几个问题:1)算法计算复杂度高。随着信号调制
二语习得对母语会产生语言迁移,日语对汉语的负迁移有很大一部分也来源于日语汉字词汇。在本篇论文日汉同传的一场模拟会议中,笔者发现日语汉字词汇出现频次高,且笔者出现偏误的场合往往是面对日语汉字词汇的场景,进一步分析后发现也有不少日语汉字词汇也对译语输出产生了正面影响。本文以安倍首相施政方针演讲模拟会议为例,对日汉同传中日语汉字词汇对译语的影响进行了分析。论文分析了案例中日语汉字词汇的类别,共计23例,
近年来,交通、水电等领域的隧道建设迅猛发展。由于地质条件极其复杂,在施工过程中突水塌方等灾害频繁发生,造成了巨大的经济损失,严重威胁着人民的生命财产安全,亟待破解隧道等地下工程的安全监测技术瓶颈。微震监测技术能够利用隧道内岩石破裂过程中产生的微震信号推测岩体的稳定性,对保证施工安全具有十分重大的意义。微震源定位是微震监测技术的核心,开展微震源精确定位技术研究具有重要的安全意义和经济意义。本文以实现
事务作为一种编程抽象,简化了关系型数据的处理。随着数据规模的增加和并发级别的高,诸如Web服务,证券交易和电子商务等众多场景越来越需要低延迟和高吞吐量的事务处理系统的
为探究不同叶色杉木叶片的光合作用能力差异,本研究选取了80株11年生杉木单株作为试验材料,分别测定各个单株的叶色值、光合色素含量、叶绿素荧光参数和光合作用参数。结果显
受显卡硬件资源的限制以及图形处理程序对GPU计算资源的高要求,计算机的GPU难以满足多个虚拟机的要求。特别是在不同的虚拟机所需要不同的GPU计算资源时,目前的GPU虚拟化技术
由于科技的快速发展和信息技术的广泛应用,产生了海量的高维数据.为了能从这些数据中获得有用的信息,研究学者提出了很多的降维方法.特征选择方法作为降维方法的一种,可以消除冗余特征,保留数据的关键特征,从而能够对高维数据进行有效处理.本文基于整数规划对无监督特征选择方法进行研究,以期望为带有矩阵l2,0范数的优化模型,特别是与特征选择相关的模型求解提供一种思路.具体工作如下:首先利用数据特征之间的重构最