论文部分内容阅读
单目图像深度估计是计算机视觉领域的热点问题。然而,受到单个摄像头的制约,想要通过空间立体几何计算图像中精确的深度信息是极其困难的。单目图像深度估计是对一幅图像上的所有像素点赋予一个相对深度关系,传统方法估计深度通常使用人工特性,极易产生重构错误。近年来CNN网络在计算机视觉领域取得了瞩目的成就。与人工特性相比,CNN特征是从大规模的数据中学习得到的,能自动高效地进行图像特征提取,同时表征图像丰富的语义信息。本文利用CNN特征来进行单目图像深度估计任务的研究,具体内容如下:(1)基于CNN特征提取和加权深度迁移的单目图像深度估计算法。单目图像的深度估计可以从相似图像及其对应的深度信息中获得。然而,图像匹配歧义和估计深度的不均匀性问题制约了这类算法的性能。为此,首先引入CNN特征来获得更精确有效的相似图像集,提出了基于CNN特征提取的单目图像深度估计算法。该算法首先提取CNN特征计算输入图像在数据集中的近邻图像;然后在每个候选近邻图像和输入图像之间获得像素级稠密空间形变函数;再将形变函数迁移至候选深度图像集,并通过对迁移后的候选深度图进行优化获得最终的深度信息。然后,针对该算法中同一目标估计深度不均匀的问题又引入了基于SIFT的迁移权重(SIFT Similar Weight,SSW),进一步提出基于CNN特征提取和加权深度迁移的单目图像深度估计算法。实验结果表明,CNN特征提取和加权深度迁移提高了深度估计的质量和准确率。(2)基于多层次CNN特征融合的单目图像深度估计算法。单目图像的深度估计可以通过CNN网络提取训练图像的高层特征获得。然而,缺乏局部细节信息导致了场景中目标估计深度不准确的问题。为此,提出了一种基于多层次CNN特征融合的单目图像深度估计算法。通过多层次CNN特征融合网络不仅提取表征图像空间结构信息的高层特征,还提取了表征图像局部细节信息的低层特征,将不同层次不同尺度的特征通过对应位置相加的方法进行融合以生成最终的深度信息。实验结果表明,该方法可以有效地重构出场景的局部细节。综上所述,本文将CNN表征的丰富图像特征表达结合和运用到单目图像深度估计任务中,所提出的方法在深度估计效果方面有了一定的提高,它为单目图像深度估计的研究提供了一些新的思路。