论文部分内容阅读
随着深度学习算法研究的不断深入,目标检测领域受到了越来越多研究者的关注。行人检测作为计算机视觉和模式识别任务中重要的子课题,有着非常广泛的应用场景,如自动驾驶、智能监控、智能机器人等。本文研究了近些年经典的卷积神经网络的国内外研究现状,还介绍了卷积神经网络的设计准则与优化方法。近年来,采用深度学习算法进行行人检测可在很多公开的行人数据集进行测试,且其实验结果要远远高于传统的机器学习算法和其他的图像处理算法。在视频和图像中,由于距离、光线不足或阴影干扰等因素,使得部分行人的像素较小,导致一些行人检测方法很难检测出这类小像素行人目标,导致增加了误检率。针对以上问题,本文采用改进的Faster RCNN算法对行人进行检测,主要研究内容包括:1.为了对卷积神经网络的输出特征有更直观的观察,我们通过特征图可视化的方法,发现浅层网络提取的是纹理和细节特征,它包含更多的特征。深层网络提取的是轮廓形状和突出特征,提取的特征更具有代表性,但细粒度信息会减少。在本文中,融合了不同卷积层输出的特征,提取的特征结合了低层信息和高层信息的特点,对小目标行人特征的描述更具代表性。最后分析实验结果,结合融合特征后的Faster RCNN网络在INRIA数据集上的误检率降低至10.31%,在Caltech数据集上的误检率降低至24.27%。2.在目标检测任务中,网络的性能很大地影响了检测的效果。本文中,在Faster RCNN模型的基础上,结合SENet(Squeeze-and-Excitation Networks)获取到每个特征通道的重要程度,提升有用的特征并抑制对当前任务用处不大的特征,这样通过特征通道之间的关系来提升网络的性能。结合SENet的Faster RCNN行人检测算法并没有增加过高的复杂度。实验结果表明,结合SENET的Faster RCNN在INRIA数据集上的误检率降低至10.20%,在Caltech数据集上的误检率降低至13.14%,改进模型在提高了检测准确率的同时,检测速度也有所提升,检测每张图片仅需0.28s。