论文部分内容阅读
计算机视觉领域中最近几年新兴两项复杂且难度又大的任务就是对图像语义分割和实例分割。随着深度学习中神经网络算法的普及,这两项任务在实际应用中变得广泛而重要。在智能交通方面,快速准确的对交通场景中的车辆进行分割是智能交通系统中的重点研究的技术之一,所以对环境多变的交通场景中的车辆语义分割和实例分割的技术研究具有重要的现实意义。随着计算机视觉步入深度学习时代,对于图像语义分割和实例分割的各个难点正在被逐渐克服,研究者们相继提出了一系列基于卷积神经网络的语义分割方法和实例分割的方法。本文主要针对于车辆语义分割对卷积神经网络模型进行改进优化以及构建对于车辆的实例分割的网络模型等方面做了研究。主要工作如下:(1)详细分析介绍了PASCAL VOC2012数据集和CITYSCAPES数据集,针对于车辆语义分割数据集不足的问题,构建了用于语义分割的数据集,即VEHICLEDATASET数据集,扩充关于车辆的语义分割的数据集。(2)本文对用于车辆的语义分割的网络复杂、且训练速度慢的问题,优化简化全卷积神经网络,将对目标的分割任务转换为基于像素的二分类问题。使用扩充后的数据集训练优化后的卷积神经网络,对比分析了分类种类不同的需求下,对网络复杂需求程度也不同的问题。在适当的降低网络复杂程度情况下,增加了网络分割的准确率。优化方法中还包括改变了网络原本使用的随机梯度下降法,选择使用Adam优化函数对网络进行训练,提高网络的训练速度。减少了网络训练的时间成本。(3)在对车辆实例分割方面,提出一种结合语义分割网络生成的掩码图和类激活图的实例分割网络模型,实现对交通环境中的车辆实例分割。图像语义分割的网络模型具有基于分类网络模型所构建的这一特点,但语义分割的掩码图只能将目标从原图中分割出来,对于同一类的实例目标却无法做出区分。而类激活技术可以直接构建在分类网络上,使用类激活技术从卷积神经网络中提取特征映射图直至生成的热力图,可以定位出不同实例在原图上的位置,实现对图像的实例区分。这样结合掩码图信息和类激活图的信息实现对车辆的实例分割。最后通过实验验证,得到了理想的实验结果。