论文部分内容阅读
双目立体视觉充分模拟人类的双眼感知场景中物体的空间距离,广泛应用于机器人导航、三维测量、人机交互等领域。立体匹配是立体视觉中最核心的问题之一。一方面弱纹理区域和遮挡/视差不连续区域的匹配准确率仍需提高,另一方面,立体匹配算法需要适应实际场景并满足实时性的要求。本文针对这两个方面的问题,深入研究了其中的图像超像素分割方法、局部立体匹配方法和基于图像分割的全局立体匹配方法,最终将所研究的算法成功地应用于路面检测中。主要的创新点和研究成果如下:(1)提出了一种基于能量方程的实时紧致超像素分割算法。通过定义一个新的能量方程使超像素具有同质的颜色、规则的形状和相似的大小。通过由粗到细的边缘精细化方法来优化能量方程,一方面避免优化陷入局部极小,另一方面提高优化的速度。最后在Berkeley数据库中测试了所提出的方法,结果显示该方法在分割精度上优于最新水平的超像素分割方法。此外,该方法能够在Intel i32.5-GHz CPU的单个核上实时地处理481x321的图像。(2)提出了一种联合边缘保持滤波和动态规划的局部立体匹配方法。匹配值累积的过程类似于用动态规划的方法来优化能量方程。通过边缘保持滤波器将平滑约束集成到能量方程中,一方面使视差不连续处的匹配更准确,另一方面放弃了传统局部立体匹配算法中采用的正平面假设,使匹配值能够在不同视差上进行累积,从而更好地适应实际场景中普遍存在的斜面和曲面。实验结果显示,所提出方法不仅在Middlebury数据库中的准确率比当前的局部方法高,而且对实景数据库KITTI具有适应性。(3)针对基于图像分割的全局立体匹配,提出了一种由粗到细的视差优化方法,通过构造新的假设检验模型,融合超像素分割信息以解决弱纹理区域和遮挡区域的匹配问题。传统的基于图像分割的全局立体匹配方法将整个超像素限制在一个视差平面中,分割错误将导致视差出错且无法校正。针对这个问题,文中将图像分割为多层不规则金字塔,逐层重标签超像素进行多尺度视差优化。通过分裂初始超像素,然后优化尺寸更小的超像素来校正图像分割错误。传统方法的另一个缺点是实时性太差。为了提高算法速度,一方面采用了已提出的快速超像素分割方法;另一方面,提出了一种快速的基于假设检验的视差优化方法。Middlebury数据库上的实验结果显示,所提出方法在准确度优于当前的基于图像分割的全局立体匹配方法,速度则是同类方法的10倍以上。