基于OpenCL的Viola-Jones人脸检测算法性能优化研究

来源 :计算机学报 | 被引量 : 0次 | 上传用户:venus521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Viola-Jones人脸检测算法是最为成功的可实用的人脸检测算法之一.然而,随着该算法所在领域数据处理规模的不断扩大,现有算法的性能已经越来越无法满足日益增长的交互性与实时性要求.使用GPU计算平台提升该算法性能,以满足日益增长的实时性要求已经成为研究热点.然而,该算法在对GPU的实现和优化中,存在线程间负载不均衡的非规则特性,如果仅使用传统的优化方法,则难以在GPU计算平台上达到较高性能.针对此种情况,该文构建了针对此类算法的并行优化框架,通过Uberkernel、粗粒度并行、Persistent Thread、线程与数据的动态映射、全局及本地队列等优化方法的应用,突破了负载不均衡非规则特性导致的性能瓶颈,大幅提高了人脸检测算法在GPU计算平台上的性能.同时,该文通过对不同GPU计算平台关键性能参数的定义、抽取和传递,实现了该算法在不同GPU计算平台间的性能移植.实验结果表明,与OpenCV2.4中经过高度优化的CPU版本在Intel Xeon X5550CPU上的性能相比,优化后的算法在AMD HD7970和NVIDIA GTX680两个不同GPU计算平台上分别达到了11.24~20.27和9.24~17.62倍的加速比,不仅实现了高性能,而且实现了在不同GPU计算平台间的性能移植.
其他文献
目的:调查什锦凉拌菜类食品制作与冷藏过程中微生物污染与卫生质量变化情况,为餐饮业实施该类食品的HACCP管理体系,确保饮食安全提供参考依据。方法:参照文献并经试制拟定什
施工企业党员干部尤其是领导干部如果不注意加强思想改造,不能严格约束自己、把握自己,即使制度再完善、管理再严格、监督再有力,也不能避免一些人以身试法。因此,作为施工企
随着城市基础设施的持续建设,城市轨道交通建设得到快速发展。但受旧有城市规划的制约,新的地铁在施工中将不可避免地会部分穿越既有建(构)筑物的基础。如何进行既有建筑物桩