【摘 要】
:
OpenCL是面向异构计算平台的通用编程框架,然而由于硬件体系结构的差异,如何在平台间功能移植的基础上实现性能移植仍是有待研究的问题。当前已有算法优化研究一般只针对单一
【机 构】
:
中国科学院软件研究所并行软件与计算科学实验室,中国海洋大学信息科学与工程学院,中国科学院软件研究所计算机科学国家重点实验室,中国科学院研究生院
【基金项目】
:
国家自然科学基金项目(60303020,40806040);国家自然科学基金重点项目(60533020);国家“863”计划基金项目(2006AA01A102,2R2010FM002);ISCAS-AMD联合fusion软件中心资助
论文部分内容阅读
OpenCL是面向异构计算平台的通用编程框架,然而由于硬件体系结构的差异,如何在平台间功能移植的基础上实现性能移植仍是有待研究的问题。当前已有算法优化研究一般只针对单一硬件平台,它们很难实现在不同平台上的高效运行。在分析了不同GPU平台底层硬件架构的基础上,从Global Memory的访存效率、GPU计算资源的有效利用率及其硬件资源的限制等多个角度考察了不同优化方法在不同GPU硬件平台上对性能的影响;并在此基础上实现了基于OpenCL的拉普拉斯图像增强算法。实验结果表明,优化后的算法在不考虑数据传输时间的前提下,在AMD和NVIDIA GPU上都取得了3.7~136.1倍、平均56.7倍的性能加速,优化后的kernel比NVIDIA NPP库中相应函数也取得了12.3%~346.7%、平均143.1%的性能提升,验证了提出的优化方法的有效性和性能可移植性。
其他文献
介绍了钢板桩的一些优点,从钢板桩的制作、钢板桩吊运与堆放、钢板桩的施打、基坑的开挖及钢板桩的拔出等方面阐述了基础工程中钢板桩的施工工艺,以进一步推广钢板桩的应用。
目的观察中西医结合治疗抑郁症的疗效与安全性。方法将抑郁症患者68例随机分为治疗组及对照组各34例,分别采用中西医结合治疗与单纯西药治疗,疗程均为4周,采用汉密顿抑郁量表
文章以河南省上市公司2008—2011年的数据作为研究样本,分析了资本结构和股权结构对公司绩效的影响。实证结果表明,资产负债率和长期负债率均与企业经营绩效显著负相关,意味
讲述了曲线桥梁在道路设计中广泛的应用,叙述了曲线桥梁的箱梁构造、支座形式、支反力计算、内力计算和配筋计算,介绍了曲线桥梁计算中计算机软件的应用,从而为桥梁结构钢筋
针对道路工程施工测量工作的重要性,从勘测设计阶段、施工阶段、运营阶段三个阶段详细介绍了道路施工测量的步骤和方法,探讨了现代测量技术的发展,积累了道路施工测量经验。
确定了乳化海绵蛋糕生产的最佳工艺条件,用正交试验探讨由分子蒸馏单甘酯、蔗糖脂肪酸酯、司盘-60、山梨醇液复合的蛋糕乳化剂对打擦度、蛋糕体积得率、浆料比重与蛋糕品质的
本文使用一种以卡拉胶、B胶*、三聚磷酸钠、氯化钙与氯化钾复配生产凝胶软糖的方法,得出了较好的凝胶软糖粉的配方,并研究了凝胶软糖适宜的加工工艺及条件。*l-卡拉胶
在明确垂直绿化概念的基础上,阐述了垂直绿化在城市绿化中的重要作用,介绍了垂直绿化的类型,同时分析了垂直绿化材料的选择,通过实施垂直绿化措施,从而更好地改善城市人居环
风险评估是上市公司内部控制的起点。然而,许多上市公司在实施内部控制时,风险评估环节却成为内部控制工作推进的障碍。文章针对上市公司风险评估的流程进行了剖析,并就如何
随着焊接技术的不断发展,螺柱焊具有全截面焊接、标准化作业以及焊接效率高和质量可靠等优势,被广泛应用于汽车车身的焊接工艺中。因此,本文将着重探讨螺柱焊在车身焊接工艺