论文部分内容阅读
随着计算机技术的快速发展,人们对视觉的要求不再满足于二维信息,而是更多得向三维立体方向扩展,立体视觉也相应的在人类生活中扮演着越来越重要的角色。立体视觉在三维重建,目标检测,机器人视觉,虚拟现实等方面都有着重要的应用,是计算机视觉中重要的分支。本文介绍了立体视觉中的核心立体匹配技术,立体匹配的任务是计算左右立体图像对的视差值,进而得到场景的深度信息。本文系统介绍了立体匹配相关理论,包括与其相关的摄像机标定及极线几何技术,立体匹配算法的步骤和分类情况,分析了不同算法的匹配精度和效率,提出了自己的改进算法。本文基于MST(最小生成树)与OII(十字臂正交聚合)技术,提出一种高效的全局立体匹配算法。算法首先利用WLD(韦伯描述子)分通道计算左右视图的初始匹配代价;其次采用基于MST的代价聚合方式对初始匹配代价进行聚合,利用MST的节点间关系确定每个像素的相关像素十字臂结构,对像素的支持区域进行匹配代价聚合更新,最后采用多线程编程方式进一步优化算法的效率。本文提出基于MST和时域相关性结合的针对立体视频的匹配算法,利用三帧差法提取视频相邻帧之间的运动信息,通过对相对运动区域和静止区域采用不同的处理方式更新视差值,确定视差序列。利用时空域结合的方法确定的视差序列,不仅可以提高视差的精度和效率,同时明显减轻了人眼敏感的视频帧间闪烁问题。本文采用VS2010与Opencv结合的方式对全局立体匹配算法和时空域结合的立体视频匹配算法的精确度和效率进行了验证实现,生成了动态链接库,完成了算法的模块化。同时,本文构建了视差视频提取的实验平台,可以将输入的左右格式的立体视频经算法处理后直接输出视差图视频,方便了后期的三维显示,提高了整个三维显示系统的运行效率。