论文部分内容阅读
智能交通在当今社会得到越来越多的关注,同时也获得了快速发展。车辆行人检测技术作为智能交通的核心点,被普遍应用在视频监控、车辆辅助驾驶和仿生机器人等各个领域。车辆行人检测不同于一般的目标检测,我们必须有更高的速度和准确率才能保证驾驶人在复杂的交通环境下安全行驶。在现实生活的实际场景中,交通路面情况复杂、天气多变、目标大小不一、行人姿态和穿着不同、行人车辆间互相遮挡都为我们的研究工作带来了更大的挑战。近年来,深度学习的卷积神经网络方法在模式识别大赛变得越来越受欢迎,并且在各种数据集上都获得了举世瞩目的效果。大多数深度学习的检测方法都包含3个主要部分:特征提取、区域建议和ROI分类。本文的研究重点则是针对Faster R-CNN系统框架,重新设计特征提取部分。本文的主要研究内容和突出贡献能够概括为以下两点:(1)实现一种基于特征融合的多尺度卷积神经网络模型MSFF-CNN。通常来说CNN模型的层数越深,训练所需要得到的参数就会越多,模型的泛化能力也就更好,但也意味着更长的处理时间。针对这个问题,本文利用预训练完成的网络模型,保持原VGG16的参数不变,并加入新的网络结构进行微调,获得了一个更高的精确度,而且也保持了原来的处理速度。基本所有的目标检测系统都会遇到同一个问题,就是检测目标大小不一,不能很好的检测较小的目标。相对来说不同尺寸卷积核的感受野也不同,大尺寸的卷积核有利于提取全局特征,小尺寸的适用于局部特征。本文结合不同大小的卷积核,在原VGG16模型的基础之上加入多尺度结构,可以较好的适应多种不一样大小的目标。对于卷积神经网络,低层特征图是细节信息,有利于边框定位。而高层次的特征图表示的是语义信息,有利于分类。因此本文通过融合高低层特征,进而获得更好的检测效果。(2)提出并实现一种改进的局部多尺度和全局特征融合网络模型GFFLMS-CNN。在原有的研究基础上,根据提出模型的不足,改进特征融合结构。重新设计多尺度网络结构,针对高低层特征图设计不同的多尺度。将全局多尺度替换为局部多尺度,最后进行特征融合。这样保持了原特征图的高低层顺序,也就是保持细节信息和语义信息不被破坏,因此获得更好的融合效果。除了专门针对车辆行人的数据集KITTI,本文还使用了在目标检测领域广泛使用的PACAL VOC数据集进行实验,以此来评估本文算法。实验结果表明本文算法获得了更高的精确度,并维持了原算法模型的速度,达到基本的实时要求。