论文部分内容阅读
视觉是人类观察世界、认识世界的重要手段。科学研究和统计表明,人类从外界获得的信息约有75%是从视觉中得到的。人类通过眼睛和大脑来获取、处理和理解视觉信息。
计算机视觉就是用计算机实现人的视觉功能,对客观世界的三维信息进行感知和解释的一门学科。计算机视觉的研究目的是要使计算机具有通过三维图像认知维信息的能力,包括目标物体的形状、位置、姿态、运动等。计算机视觉研究的内容十分广泛,包括立体视觉、运动视觉、颜色视觉、主动视觉等。计算机视觉的本质是从二维图像信息重构三维物体的可视部分,三维物体表面的重建和表达问题在视觉研究中不仅具有重要的理论价值,而且也有着广泛的应用需求。尽管人们已在该领域进行了大量的工作,但是随着制造自动化、设计自动化、车辆导航、智能机器人、人脸识别等技术的发展,迫切需求快速、精确、鲁棒性强、适用面广的三维物体形状重建方法,对计算机视觉理论的发展提出了更高的要求。
立体视觉是计算机视觉的一个重要分支,而其中基于两幅图像的双目立体视觉是立体视觉的一个研究热点。双目立体视觉直接模拟人类双眼处理景物的方式,从两个视点观察同一个景物,即由不同位置的两台或一台摄像机经过移动或旋转拍摄同一幅场景,通过三角测量的原理计算空间点在两幅图像像素间的视差来恢复目标物体的深度信息。最后通过得到的深度信息来恢复出物体的表面形状。一个完整的计算机三维重建系统可以分为六个部分:图像采集、摄像机标定、图像处理及特征提取、图像立体匹配、深度信息计算、物体表面三维重建及后处理。其中的关键技术有摄像机标定、图像立体匹配,以及后处理三项。
本文首先介绍了双目视觉理论,然后对摄像机标定理论进行阐述。针对双目视觉中的难点问题--图像的立体匹配,本文提出了一种基于小波多分辨率特性的字符串匹配算法,并进行了程序实验分析。先通过对图像进行小波变换得到低层次的概貌图像,然后对概貌图像进行字符串匹配。得到立体匹配对后,在进行由低层次到高层次的相关匹配工作,最终达到对两幅图像进行匹配的目的。文章最后对三角测距原理以及三维重建过程进行了简要介绍,并对现有算法提出展望。文章的重点主要在对摄像机标定、图像处理及特征提取、图像匹配进行了分析。本文算法的实现应用MATLAB软件,借助MATLAB功能强大的工具箱来完成实验要求。