论文部分内容阅读
让计算机和人一样拥有目标检测与识别能力,一直都是人类的梦想。现实生活中目标可以分为有丰富纹理的目标和少纹理目标,丰富纹理的目标检测识别技术已经比较成熟,因此本文着重研究少纹理目标检测识别。目标检测识别技术通常需要适应复杂的环境,存在背景杂乱、光照变化、目标尺度和视角变化、目标被遮挡等问题。针对这些问题,研究人员提出了许多目标检测与识别算法。本文试图实现对少纹理目标进行实时鲁棒检测识别,主要进行了以下几方面工作:(1)提取包含一般目标类别的候选区域加速目标检测识别过程。传统的目标检测识别方式是在输入图像上通过滑动窗口方式,识别每一个窗口是否包含目标。通常输入图像中会存在大量不包含目标的背景区域,在这些区域中检测目标会浪费大量时间。本文改进已有的候选窗口提取方法Selective Search,并利用改进的算法提取包含一般目标的候选区域,最后只在这些候选区域中识别是否存在目标,大大提高目标检测效率。(2)通过模板匹配进行少纹理目标检测识别。少纹理目标主要在目标轮廓上提取特征进行匹配。DOT方法通过在少纹理目标轮廓上提取主梯度方向作为特征,将目标模板以滑动窗口方式和输入图像进行匹配。但是在输入图像背景杂乱或者存在与目标轮廓相似的干扰物体时,DOT方法目标检测性能很低。本文在已有DOT方法上进行扩展,先为DOT方法模板匹配相似度设置一个阈值,返回输入图像中匹配相似度大于该阈值的所有窗口,在模板上区分度大的局部区域提取颜色特征,和返回的窗口进行二次匹配,排除不包含目标的干扰窗口。(3)通过卷积神经网络进行少纹理目标检测识别。目前卷积神经网络(CNN)应用研究主要集中在深度模型区域,然而在目标类别比较少、训练数据有限时可以采用浅层网络。本文通过训练两个浅层CNN实现少纹理目标的检测识别。第一个网络用于对目标进行分类,第二个网络则用于将目标特征映射到低维空间中,利用最近邻方法在低维空间中找到与待检测图像目标视角最接近的模板,从而实现在输入图像中不仅检测出目标位置,同时识别目标的三维姿态。为了验证本文方法的效果,本文在多个数据库中进行了实验,这些数据库分别包含复杂背景、部分遮挡、存在相似轮廓物体等复杂情况。测试结果表明,本文方法能实现复杂环境下少纹理目标检测识别。