论文部分内容阅读
双目立体视觉基于视差原理,主要研究如何从(两幅或者多幅)图像里获取场景中物体的距离(深度)信息。其中一个重要研究问题是立体匹配,即如何在多幅图像中确定对应点。随着大量新算法的提出,立体匹配问题的研究取得了重大进展。立体匹配研究领域,每年有大量新算法提出。尽管,这些算法特征各异,我们可以利用MIT的评价平台进行有效的比较研究。按照Daniel Scharstein和Richard Szeliski的研究,立体匹配算法主要分为两大类:局部算法和全局算法。全局算法把匹配转化为一个能量最小化的问题,一般有较高的计算精度,但是一般结构比较复杂,时间复杂度很高,很难实时应用。局部算法以基于窗口的算法为主。同全局算法相比,它们结构简单,效率更高,只是得到的视差图精度不高。由于局部算法结构清晰,易于加速,在实时应用领域占有重要地位。目前匹配算法众多,结构迥异,基本原理各有偏重,给分析研究工作带来诸多困难,因此本论文中我们对众多研究者的算法进行分类研究,以更好的了解国内外该行业的研究进展。本论文中,我们将重点研究局部匹配算法。一般局部匹配算法基于以下假设:有限邻域内具有相似特征的点具有相近的深度值且视差是连续变化的。通常,立体匹配算法可以分为四部分,即:匹配费用计算,费用聚合,视差选择,视差改良。大部分研究者在视差选择这一步采用WTA策略(赢家通吃),同时致力于通过改善其它三部分来提高匹配精度。一般,首先进行一个包含前三步的初级匹配,然后对特定区域进行视差重新调整进一步改善匹配结果。本论文中,我们重点对费用聚合进行改良,提出一种新的基于窗口的匹配算法。我们的算法结构流程简洁。首先,提出一种新的聚合方法来进行初级匹配,同时在这一步中进行左右检测,然后对初级匹配的结果进行简单的调整。我们的算法结构简单,易于扩充,可以很方便的移植到其它局部匹配中,用以改善局部匹配结果,同时也可以用于部分全局匹配结果的改良,具有很高的实用价值,并在精度和效率方面取得了很好的平衡。为了方便比较研究,我们同时描述了早期工作中所发表的一种局部匹配算法——自适应局部调整算法。这一算法与我们本论文中的算法具有相似的结构流程,不同的匹配策略。自适应局部调整算法核心在于误匹配区域的确定和自适应局部调整;而本论文的算法重点是提出一种新的聚合方法。我们将在正文中对这两种算法进行详细讨论。我们针对标准图像进行了大量实验,并将实验结果提交到MIT的实验评估平台上,进行了比较研究。试验结果表明,我们的算法匹配精度很高。是切实可行的。