CPU-GPU异构系统上应用映射的若干优化策略

来源 :第十三届计算机工程与工艺会议(NCCET09’) | 被引量 : 0次 | 上传用户:woainiwgy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
GPU作为简单多核处理器的典型代表,其强大的浮点运算能力使得其具有进行大规模科学运算的能力,统一架构GPU[1]和相关的并行编程模型的出现在保持其强大运算能力的同时增加了可编程性.如何减少程序实际性能与GPU理想性能之间的差异也成为了利用GPU进行高性能计算时必须面对的问题.本文分析了提高计算访存比和降低访存平均延迟对CUDA程序性能的影响,并以GPU上矩阵乘法[3]为例量化地分析了二者所带来的性能提升比例,总结了在CPU-GPU之间进行同步执行时最佳任务划分比例因子的求解公式,同样以矩阵乘法为该公式的正确性进行了验证.
其他文献
1916年出生在江苏无锡的荣毅仁,不仅是一位成功的商人,也是具有影响力的政治家。凭着刚毅仁厚的品质和强烈的爱国情怀,他为中国民族产业的发展做出了重要贡献。1979年,邓小平
日益复杂的应用需求,使得SoC功能复杂度、性能以及集成度迅速提高,给SoC设计和验证带来了新的技术挑战,势必要求我们必须采用更为可靠和有效的设计和验证方案.本论文以SoC软
会议
大樱桃 [Cerasusavium (L .)Moench]又称西洋樱桃、欧洲甜樱桃、甜樱桃、洋樱桃等。大樱桃花期较晚 ,不易受冻害 ,可连年丰产。由于果实个大、色艳、味美 ,市场销售价每千克 2 0元以上 ,有广阔的
随着集成电路制造工艺水平发展到超深亚微米阶段,SoC(System on Chip)的功耗问题越来越突出,成为继续提升性能的主要障碍.功耗的显著增加不但引起能源消耗和制造成本增加,而
会议
SoC设计的关键环节之一为功能验证.针对基于通用处理器的SoC存在各种虚拟机的特点,本文提出了基于虚拟机的SoC仿真原型VMSIM,使用虚拟机作为SoC设计的参照模型进行功能验证.V
会议
运用认知语言学的图式理论和元认知理论分析了计算机英语写作中存在的问题,探讨了元认知理论在计算机英语写作中的重要指导作用,以及培养元认知技能的重要性.
本文报告了江苏省南京、扬州和常州3个地区,淡色库蚊、中华按蚊和三带喙库蚊对DDT、DDVP、马拉硫磷、溴氰菊酯、和氯菊酯5种杀虫剂产生抗性的趋势。 In this paper, five sp
SoC设计技术可以充分利用已有的设计积累,显著提高ASIC的设计能力,因此受到了广泛关注.集成电路制造工艺的发展使得芯片集成度越来越高,单芯片晶体管数目越来越多,可以把更多
会议
SoC