论文部分内容阅读
近年来,自动驾驶成为了世界范围内的各大汽车公司和互联网公司的研究热点,而自动驾驶领域的高级驾驶员辅助系统已得到了广泛的应用。目标检测是高级驾驶员辅助系统的关键算法之一。在汽车辅助驾驶的场景中,对于目标检测的实时性要求较高,且城市道路场景复杂,目标间相互有严重的遮挡,多数目标在该场景下的面积占比较小。因此针对这种复杂场景设计高效的目标检测系统具有挑战性。本文研究基于深度卷积神经网络的目标检测方法,并使用公开数据集KITTI作为实验的训练集和测试集,主要的研究工作包括:首先,针对高级驾驶员辅助系统对于实时性与内存的要求,本文对RetinaNet进行轻量化改造,使用PeleeNet作为骨干网络并优化分类回归子网,提高检测速度,降低网络复杂度,方便算法以后在硬件上的移植;其次,基于数据集的先验信息设计更合理的锚点框,进而提高检测精度;然后,通过融合三层次特征并结合注意力机制进一步提高模型的检测性能;最后,基于PeleeNet-RetinaNet检测模型,提出一种对部分增强多尺度特征图进行自适应空间特征融合(Adaptively Spatial Feature Fusion-ASFF)的特征金字塔,在降低参数量和运算量的同时,保持较高的检测性能。在KITTI数据集上进行实验,结果表明本文提出的基于ASFF的PeleeNet-RetinaNet检测模型的性能优于基于ResNet-50的RetinaNet检测模型,而参数数量仅为其13.9%,检测速度是其3.14倍。