论文部分内容阅读
智能汽车由环境感知、决策规划和相关的执行结构组成。智能车辆能够在道路上正常行驶,环境感知部分起着最重要的,它影响着决策规划层所作出的决策,最终影响到车辆的运动状态。在环境感知部分中,对车辆当前所处的环境中各个目标对象的检测和定位是非常重要的,它影响着车辆决策层的加速、制动和超车等行为的决策。传统的目标检测和定位方法存在着较大的误检率和漏检率,对目标的定位也偏差较大。因为深度学习在目标检测和定位方面的巨大优势,因此对深度学习在这方面的研究有着巨大的理论和实用价值。常见的基于图像的目标定位与检测系统分为三个步骤:图像分割、目标关键特征提取和目标分类。基于当前智能汽车环境感知部分对图像处理的相关要求,本次课题对各个步骤涉及到的知识和具体的性能要求进行了详细的调研。深度学习有着广泛的应用领域,因此也对应着不同的深度学习模型。在本次课题探究的图像处理领域,众多的改进和优化的模型都基于卷积神经网络(CNN)这个最基本的模型进行。卷积神经网络可以构建很深的网络结构,可以使得网络达到很深,能够提取图像更高维的抽象特征,对图像信息的利用也更加高效。本文在分析了由VGG网络对图像中目标的定位及检测之后,基于VGG网络模型搭建一个改进的VGG模型,将常规基于图像的目标定位与检测的三大步骤进行有效的整合,改进后的模型称之为IVGG。在研究学习了目标估计网络(RPN)对图像分割的实现原理之后,提出了改进策略以提升RPN网络的性能。将改进的RPN网络应用于本课题搭建的IVGG模型中。在本次搭建的IVGG模型中,引入空间金字塔池化技术(SPP),提升目标对象的检测精度和识别的概率。利用目前开源的深度学习开发工具Caffe搭建所提出的模型,并用目前智能汽车领域常用的KITTI数据集来训练和测试所搭建的模型,根据相应的测试结果评估所搭建的模型的准确性。文章的最后对本次课题学习的过程中遇见的难题以及相关的解决方法进行了总结,同时对于未来智能车辆对图像处理目标检测和识别进行了相关的展望。