论文部分内容阅读
水下单目视觉定位是水下机器人视觉感知中的关键技术,在水下安防、水雷探测、海底地形探测、水下探坝、水下对接等领域具有极高的应用前景。本文针对水下机器人单目视觉定位工程任务需求,建立了一套基于深度学习的闭环水下机器人单目视觉定位方案,并对方案中的水下摄像机成像建模、基于深度学习的水下目标检测、水下单目视觉目标深度估计与定位、基于目标状态估计的水下图像预分割等关键问题开展了研究。
首先,分析了水下摄像机成像过程中折射对视觉定位的影响,提出了一种基于二次投影的水下摄像机成像模型,将复杂的水下成像拆分为水下非线性折射投影与空气中线性投影,同时对模型的迭代计算方法和模型标定方法进行了研究;引入等效焦距水下摄像机成像模型设计了定位对比试验,试验结果显示本文模型的准确性及稳定性优于等效焦距模型。
其次,将深度学习目标检测算法SSD300(Single Shot Multibox Detector)引入水下目标检测中,针对水下图像数据采集困难、数据集较小而导致SSD300训练部署困难的问题,研究了基于风格迁移的数据增殖及SSD300训练的方法,并开展了针对性的目标检测试验,试验中经风格迁移数据增殖训练后的SSD300,综合平均准确率(mAP)提高了5.72%,该方法可以有效降低数据采集的成本和难度,提高神经网络训练部署速度,在工程应用中具有极高的可行性。
再次,针对单目视觉定位过程中的目标深度被动估计问题,研究了几何特征法、帧差法在本文成像模型下的实现方法;建立两种方法的量测值准确性指标,并以此开展单目视觉目标深度融合估计方法研究;设计了水下单目视觉目标深度估计试验,试验结果表明本文深度融合估计方法可以有效减小单一方法深度估计的不稳定性,提高深度估计的准确性。
之后,提出一种利用图像预分割来提高SSD300对小目标检测能力的方法,完成了基于IMM-KF(Interacting Multiple Model-Kalman Filter)的目标状态估计及图像预分割策略研究,设计了相关水池试验,与DSSD(Deconvolutional Single Shot Detector)算法与FSSD(Feature Fusion Single Shot Multibox Detector)算法进行对比,试验中图像预分割将SSD300的查准率(Precision)提升至91.4%,高于DSSD(88.1%)与FSSD(87%),同时实时性更好。
最后,在实际的水下环境中,设计了水下目标静态定位试验和水池目标定位试验,验证本文视觉定位方法在实际水下环境下的真实定位能力,并进行了准确性及稳定性对比分析。
首先,分析了水下摄像机成像过程中折射对视觉定位的影响,提出了一种基于二次投影的水下摄像机成像模型,将复杂的水下成像拆分为水下非线性折射投影与空气中线性投影,同时对模型的迭代计算方法和模型标定方法进行了研究;引入等效焦距水下摄像机成像模型设计了定位对比试验,试验结果显示本文模型的准确性及稳定性优于等效焦距模型。
其次,将深度学习目标检测算法SSD300(Single Shot Multibox Detector)引入水下目标检测中,针对水下图像数据采集困难、数据集较小而导致SSD300训练部署困难的问题,研究了基于风格迁移的数据增殖及SSD300训练的方法,并开展了针对性的目标检测试验,试验中经风格迁移数据增殖训练后的SSD300,综合平均准确率(mAP)提高了5.72%,该方法可以有效降低数据采集的成本和难度,提高神经网络训练部署速度,在工程应用中具有极高的可行性。
再次,针对单目视觉定位过程中的目标深度被动估计问题,研究了几何特征法、帧差法在本文成像模型下的实现方法;建立两种方法的量测值准确性指标,并以此开展单目视觉目标深度融合估计方法研究;设计了水下单目视觉目标深度估计试验,试验结果表明本文深度融合估计方法可以有效减小单一方法深度估计的不稳定性,提高深度估计的准确性。
之后,提出一种利用图像预分割来提高SSD300对小目标检测能力的方法,完成了基于IMM-KF(Interacting Multiple Model-Kalman Filter)的目标状态估计及图像预分割策略研究,设计了相关水池试验,与DSSD(Deconvolutional Single Shot Detector)算法与FSSD(Feature Fusion Single Shot Multibox Detector)算法进行对比,试验中图像预分割将SSD300的查准率(Precision)提升至91.4%,高于DSSD(88.1%)与FSSD(87%),同时实时性更好。
最后,在实际的水下环境中,设计了水下目标静态定位试验和水池目标定位试验,验证本文视觉定位方法在实际水下环境下的真实定位能力,并进行了准确性及稳定性对比分析。