论文部分内容阅读
随着数字图像处理相关技术的发展,图像处理能力显著增强,这为静态图像下的人体检测积累了较多的技术基础。人体检测是通过计算机视觉设备获取周围场景信息,然后通过人体检测算法对图像或视频中的目标人体进行检测,并做准确的定位。该技术在智能视频监控、智能移动设备拍照、汽车辅助驾驶、智慧城市智能交通等领域具有广泛应用。但是由于实际应用场景中非均匀光照和部分遮挡等干扰存在,干扰条件下的识别效果还不十分理想。为了提出一套对于现实场景中对于非均匀光照和部分遮挡干扰更加鲁棒的人体检测方法。本文首先对人体图像进行多特征提取并融合。提取人体图像的局部敏感梯度方向直方图(Locality Sensitive Histograms of Oriented Gradients,LSHOG)。局部敏感梯度方向直方图的优点是可以在图像中的每个位置都统计一个体现图像全局特征的梯度直方图,对于遮挡和非均匀光照有一定的抗干扰能力。将局部敏感梯度方向直方图与同样具有描述全局纹理特征能力的灰度共生矩阵(Gray Level Co-occurrence Matrix,GLCM)相结合,进一步增强特征的全局表达能力。其次将融合后的特征通过欠完备稀疏自编码器(Under-complete Sparse Auto-encoder,USAE)进行特征降维。为防止自编码器(Auto-encoder,AE)出现梯度弥散和过拟合现象,本文在模型损失函数处加入损失因子对部分节点进行抑制,以实现其稀疏性。最后本文提出了基于卷积和稀疏自编码器的人体检测网络模型,该模型使用卷积自编码器(Convolution Auto-encoder,CAE)提取原图像的高层特征,与经过USAE降维后的底层特征组合,采用极限学习机(Extreme Learning Machine,ELM)对组合特征进行分类和识别。本文在INRIA数据集裁剪出的15000个样本的数据集和Daimler数据集上进行测试,产生了较好的识别效果,证明了本文提出的人体检测模型的有效性。