自适应混合高斯背景建模算法的GPU并行优化研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:ltavip
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
运动目标检测是视频跟踪和分析的基础,其中一个首要而关键的任务是从视频序列中确定运动目标。背景消减法是目前确定运动目标最常用的方法,其核心是将当前包含运动目标的视频帧和一个背景参考帧相差,将其中差值较大的像素区域标记为运动目标。在背景建模各方法中,混合高斯建模方法是公认的检测效果和适应性都较好的方法,但其所需计算量巨大,难以实时实现。图形处理器(GPU)通过大量的流计算单元为加速此类应用提供了新的计算平台,因而针对GPU平台,挖掘背景建模算法的并行性并进行优化,以提高实时性,对于扩展其应用范围和降低应用成本,具有重要意义。通过利用GPU平台上的CUDA编译环境,从线程级并行和异步流处理并行两个方面对自适应混合高斯背景建模算法进行并行化改进。线程级并行化主要是利用CUDA的内核函数(kernel),将原算法里的每一个像素的背景更新过程映射到GPU的一个流处理单元上进行处理,通过多线程的并行执行,来加速计算速度。异步流处理优化借鉴了流计算的边传输边计算的思想,通过隐藏数据传输所带来的时延来加速计算过程。这里利用CUDA编程模型中的流概念,通过创建多个流,使每个流之间的数据传输和计算可以重叠进行,这样就从整体上获得了计算性能的提升,达到了加速的效果。同时,对每个像素的模型参数按照行序优先的规则以分块方式进行组织存放,以配合多流并行处理时内核函数处理数据的需要,保证内核函数能及时存取所需要的数据。在采用了CUDA线程级并行化后,通过对分辨率分别为384×288、640×272、720×576、1280×720和1920×1080的视频进行测试,结果表明,在Debug模式下平均建模时间分别快了40.932ms、94.656ms、228.012ms、547.759ms和861.459ms;而在Release模式下的平均建模时间分别快了10.362ms、33.421ms、71.594ms、173.609ms和156.02ms。在此基础上,以采用8个数据流为参照,进一步进行异步流处理优化后,在Release版本下的测试结果表明:在5种分辨率下,平均建模时间比优化前分别又快了2.640ms、3.769ms、10.703ms、19.331ms和55.335ms。由此可见,在GPU平台上通过线程级并行化和异步流处理优化后,确实可以大幅度地加速混合高斯背景建模算法的执行过程。本文研究工作得到国家自然科学基金项目:嵌入式多媒体流计算的自适应机制与跨层优化(编号:60873029)和华中科技大学自主创新研究基金(编号:2010MS014)的支持。
其他文献
H.264视频压缩编码标准凭借着编码质量高,低码率,网络亲和性等特点在CMMB(China Mobile Multimedia Broadcasting)手机电视中获得应用,但手机的处理能力低,H.264解码的计算复
巷道作为矿山项目中重要的空间要素,它在数字矿山系统中占有十分重要的位置。由于巷道在地下纵横交错,单纯用二维图形很难直观的表达出地下巷道几何形态和所处的空间位置,因
脱机手写数字识别是一个至今仍没有完美解决的问题,是一个很有挑战的问题。它有着广泛而重要的应用需求,如识别邮政编码、银行收据、税收票据、各种打印手写的数字等等,这吸
随着电信行业的飞速发展,除了电信的传统业务如宽带业务外,电信获得了3G牌照以后,企业获得了又一次的飞跃发展的机会,而带来这次发展的契机就是电信的移动业务,进入了3G时代,
随着计算机硬件的发展以及人工智能理论的不断完善,越来越多的简单重复性脑力劳动开始被计算机所取代,不仅极大地提高了效率,而且将人们从枯燥单调的脑力劳动中解放出来。针
随着无线传感器网络的应用越来越广泛,聚类算法被应用于此平台。聚类算法是数据挖掘和机器学习领域的一个重要的分支。无线传感器网络上的数据聚类可以应用于检测温度变化、
随着计算机信息技术和互联网的不断发展,以数字化技术为主的嵌入式产品正在广泛的应用于工业自动化、移动通讯、医疗仪器和家用电器等各个方面。嵌入式开发已经成为当今信息
第三方组件的广泛使用给软件开发带来很大方便的同时,其源代码不可知性也给软件工程带来一定的挑战。组件软件系统的某些功能是通过不同组件之间的相互协调、调用和通信来完
多核Cache中共享最后一级Cache(Last Level Cache,LLC)已经是一个研究热点。多核体系结构中LLC通常为共享L2 Cache,当被访问的数据块不在L2 Cache中时,将会发生L2缺失,CPU需
作为物联网的基础技术之一,无线传感器网络(简称WSN)成为当前研究热点。传感器节点的应用促成了网络与物理系统的连接,但由此带来更严重的敏感信息暴露问题,且传感网络的无线传