论文部分内容阅读
近几年来,由于人工智能的不断普及,智能汽车以及汽车辅助驾驶等方向逐渐成为技术变革新一轮的前进方向,并取得了相当不错的成果。其中对视频流中目标(包括行人、汽车以及交通灯等)的检测、识别、分割与测距是智能汽车辅助驾驶系统的重要组成部分。自从2012年的Alex Net在Image Net大赛中博得第一名,深度学习不断在目标的检测、识别与分割等领域取得佳绩,同时在计算机视觉领域,采用双目立体视觉对目标进行距离探测也逐渐被许多研究学者关注。但以上方案仍然存在算法计算量过大导致的实时性不足的问题。目标的检测、识别与分割是目标测距的前提和基础,由于本文的目的是获得目标的精准分割图,且目前将检测、识别与分割综合到一起的算法只有Mask RCNN,所以本文实现目标检测、识别与分割的基本方案为Mask R-CNN算法;同时利用双目立体视觉对目标进行测距。并且针对以上几种算法中所涉及到的实时性不足的问题,提出了如下解决方案。首先,本文针对Mask R-CNN的参数过多、计算量较大以致实时性不足的问题,提出了基于Mobile Net V2的Mask R-CNN算法,利用Mobile Net V2替换Mask R-CNN中的特征提取网络,有效的减少了Mask R-CNN的运算时间,并给出了包括平均运行时间以及m AP(mean Average Precision)值在内的实测数据来验证有效性。其次,本文针对基于Mobile Net V2的Mask R-CNN算法无法达到实时性的问题,进一步提出了结合光流法的基于Mobile Net V2的Mask R-CNN算法,利用光流法对所识别的目标进行连续帧的跟踪,有效减少了基于Mobile Net V2的Mask R-CNN算法的运行时间。最后,在对目标深度进行提取的问题上,本文先概述了双目立体视觉算法,并针对双目立体视觉中的匹配算法实时性不足的问题,提出了一种融合基于Mobile Net V2的Mask R-CNN算法的双目匹配算法。算法的创新性在于直接利用了基于Mobile Net V2的Mask R-CNN算法所得到的目标信息,避免了全图匹配所带来的时间损耗,并且给出了测距误差率来验证算法。