论文部分内容阅读
随着交通系统中车辆数量的不断增加,智能化的视频监控和管理的重要性也在与日俱增,并逐渐成为人工智能最重要的领域之一。车辆相关的问题正在得到广泛的研究和应用。因为交通管理等部门有着海量的视频图像监控数据,计算机视觉与深度学习算法在各种相关技术中脱颖而出,成为最流行的研究方法。本文研究了基于视觉的车辆精细分类和重识别方法。针对应用场景复杂、设备运算能力不足、图像视频数据分辨力不足等问题,本文从多个角度提出多种方法来解决这些问题,并获得的良好的结果。本文的主要研究内容如下:1.针对现有的车牌识别网络层数过多,速度过慢的问题,本文提出了一个轻量级的、基于字符的车牌识别网络。与以往将车牌作为一个整体识别不同,该模型将车牌每一位分开识别且优化了每一位车牌的划分方法,从而有效的减少了整体识别带来的误差。模型对高层特征图进行有重叠的剪切操作来实现高鲁棒性的识别,并针对车牌排列特点设计了不同的重叠率。此外,精简了识别模型,提高了模型速度。实验结果表明该模型在保证高准确度的情况下显著快于其他方法。2.针对精细分类领域对车型分类研究少、泛化精细分类模型对车型分类的问题表达能力不足等问题,本文提出了基于深度学习的车辆精细分类网络。本文设计车辆姿态分类网络将车辆分为五种姿态;设计关键点回归网络得到车辆语义特征丰富的关键点;使用切片技术提取出具有强辨别力的关键区域,与直接分类相比,由关键点得到的区域特征更有描述力和判别力。然后将其与车辆整体的特征进行有效融合,形成由粗到精的多级特征表示。实验结果表明,本文提出的融合车辆整体与关键区域的分类方法,能够有效的提高车型分类的准确度,满足实际场景应用的要求。3.针对车辆重识别任务中的复杂的类内和类间差异,本文提出了一种基于部件融合特征的方法。与其他方法直接获取部件区域不同,本文通过栅格化的空间变化网络实现了车辆的自动定位和区域特征的划分。此外,改进并使用了残差注意力模块来实现对车辆的部件区域的细粒度级别的特征提取。最后,将这些特征进行融合,来实现高效的特征嵌入。在损失函数方面,使用层级式排序损失,将同一辆车的图像紧凑地聚集到一起,同时有效增大不同车辆以及不同车型之间的间距。基于该损失的监督和高效的特征融合,卷积神经网络可以学习到由粗到精的结构化的特征空间,增强了特征之间的类内紧密型和类间判别性,得到车辆的多层级语义特征。实验结果表明,该方法比起之前最好的车辆重识别方法在准确度上提升了超过6%。