论文部分内容阅读
平躺人体检测是近年计算机视觉研究中的热点,从市场需求的角度看,其研究成果可广泛应用在灾害救助和家庭服务机器人等领域中;从理论研究角度看,开展平躺人体检测有助于促进模式识别、图像处理等相关学科的发展。因此,开展平躺人体检测具有重要的应用价值和理论意义。
但目前平躺人体检测的研究处于起步阶段,存在视角变化大、姿态多样、背景复杂等尚未解决的问题。针对这些问题,本文提出基于滑动窗口法的平躺人体检测方法,论文的主要工作和创新点如下:
(1)针对当前平躺人体数据集相对缺乏的不足,建立了厦门大学平躺人体数据库。数据库是平躺人体检测基本而又重要的组成部分,数据库的好坏直接影响到分类器的“优劣”。本文建立的真实场景下的行人数据库具有分辨率较高、视角多样、背景变化多样的特点。为方便对平躺人体进行标注,开发了相应的标注辅助软件,每幅图像的标注结果给出平躺人体的矩形框信息和人体相对于水平面的旋转角。
(2)针对平躺人体的表观多样性,采用HOG和LBP特征融合方式,提高了检测率。不同的特征描述子从不同的方面来描述图像的特性,多特征的融合有助于全面刻画平躺人体的特征,从而提高检测性能。HOG和LBP特征分别从梯度和纹理两个不同的侧面来刻画人体特征,且二者均为基于直方图的特征。实验结果表明,通过二者融合来提取人体特征的方式,较大程度的消除了人体旋转和光照变化等带来的影响。
(3)针对平躺人体的多视角问题,提出了一种基于滑动窗口法的层次化快速窗口融合方法。滑动窗口法为了解决目标尺度变化不一的问题,通过对图片进行多尺度缩放,在每张缩放的图片内遍历窗口。同理,为了解决目标在平面内的旋转问题,首先对图片进行旋转,然后在旋转后的图片内滑动检测窗口。通过在图像的尺度.旋转空间内采用滑动窗口在方式,可以有效解决目标的平面内旋转问题。滑动窗口法在平躺人体检测的人体周围会产生多个检测窗口,而且某些非平躺人体区域也会得到较高的检测值而被框定为目标区域,在这种情况下,如何对这些窗口进行有效“合并”,准确定位平躺人体位置,成为平躺人体检测技术后期处理的关键步骤。针对该问题,本文采用层次化均值漂移法,解决窗口融合问题。
总之,本文从特征表示和分类与定位这两个平躺人体检测的核心问题入手,首先采用了HOG与LBP的特征融合方式,然后针对平躺人体的多视角问题,提出了一种基于滑动窗口法的层次化快速窗口融合方法。实验结果表明:本文提出的平躺人体检测方法的有效性,其结果有利于相关学科不断向前发展,并促进其应用价值进一步实用化。