基于双目视觉的三维重建研究

来源 :陕西科技大学 | 被引量 : 0次 | 上传用户:jackyddd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视觉是人类观察世界、认识世界的重要手段。科学研究和统计表明,人类从外界获得的信息约有75%是从视觉中得到的。人类通过眼睛和大脑来获取、处理和理解视觉信息。 计算机视觉就是用计算机实现人的视觉功能,对客观世界的三维信息进行感知和解释的一门学科。计算机视觉的研究目的是要使计算机具有通过三维图像认知维信息的能力,包括目标物体的形状、位置、姿态、运动等。计算机视觉研究的内容十分广泛,包括立体视觉、运动视觉、颜色视觉、主动视觉等。计算机视觉的本质是从二维图像信息重构三维物体的可视部分,三维物体表面的重建和表达问题在视觉研究中不仅具有重要的理论价值,而且也有着广泛的应用需求。尽管人们已在该领域进行了大量的工作,但是随着制造自动化、设计自动化、车辆导航、智能机器人、人脸识别等技术的发展,迫切需求快速、精确、鲁棒性强、适用面广的三维物体形状重建方法,对计算机视觉理论的发展提出了更高的要求。 立体视觉是计算机视觉的一个重要分支,而其中基于两幅图像的双目立体视觉是立体视觉的一个研究热点。双目立体视觉直接模拟人类双眼处理景物的方式,从两个视点观察同一个景物,即由不同位置的两台或一台摄像机经过移动或旋转拍摄同一幅场景,通过三角测量的原理计算空间点在两幅图像像素间的视差来恢复目标物体的深度信息。最后通过得到的深度信息来恢复出物体的表面形状。一个完整的计算机三维重建系统可以分为六个部分:图像采集、摄像机标定、图像处理及特征提取、图像立体匹配、深度信息计算、物体表面三维重建及后处理。其中的关键技术有摄像机标定、图像立体匹配,以及后处理三项。 本文首先介绍了双目视觉理论,然后对摄像机标定理论进行阐述。针对双目视觉中的难点问题--图像的立体匹配,本文提出了一种基于小波多分辨率特性的字符串匹配算法,并进行了程序实验分析。先通过对图像进行小波变换得到低层次的概貌图像,然后对概貌图像进行字符串匹配。得到立体匹配对后,在进行由低层次到高层次的相关匹配工作,最终达到对两幅图像进行匹配的目的。文章最后对三角测距原理以及三维重建过程进行了简要介绍,并对现有算法提出展望。文章的重点主要在对摄像机标定、图像处理及特征提取、图像匹配进行了分析。本文算法的实现应用MATLAB软件,借助MATLAB功能强大的工具箱来完成实验要求。
其他文献
网格是当前并行与分布式计算技术的一个重要发展方向,其目标是实现对地理上广泛分布的大量异构资源进行共享。资源管理是网格的关键技术之一,但是由于网格固有的异构性、分布
普适计算是适应计算机及相关技术发展的新型计算模式,它使人们能够随时随地地使用计算资源和信息服务。无线传感器网络是普适计算的重要研究领域。集成了传感器、微机电系统和
现在的许多大学都拥有自己的高性能计算资源,通常情况下,这些资源都是分散的,无法让广大的科研工作者统一使用,以解决长期困扰他们的大规模计算问题。本文提出一种应用网格计算技
上世纪90年代提出的格子波尔兹曼算法(LBM)是计算流体力学中最常用和最容易实现的并行算法之一。但是,该算法目前还存在着明显的局限性:在高速流动情况下,经典LBM算法不能适用。
集成了传感器、嵌入式计算、网络和无线通信四大技术而形成的无线传感器网络是一种全新的信息获取和处理技术,它是一种新型的无基础设施的无线网络,能够协作地实时监测、感知
新一代的网络技术Ad hoc网络,是一种没有有线基础设施支持的无线网络。由于其动态网络拓扑结构、无中心控制等特点,使得移动Ad hoc网络的安全问题成为关键问题之一。当前移动Ad
随着Internet和Web技术的发展,Web应用系统在Internet上的使用也越来越广泛。特别是互联网进入Web 2.0时代,Web应用以内容为中心,转向以个人为中心、以内容为媒介。那么个人学习
信息化的发展无疑对当前公安工作产生了深远的影响,其最直接的表现就是促进了当前公安工作运行模式的转变。公安的行为由行政行为和侦查行为构成,其中侦查行中的案件现场记录
本论文针对CNC自动编程问题本身的特点及有机集成要求,拟采用优化理论和分布式人工智能中的智能Agent理论对该问题进行研究,寻找新的CNC自动编程的实现方法,并实现CNC加工过程中
网格技术是基于Internet的分布式计算技术发展起来的一组新兴技术,网格也被认为是下一代互联网和未来的计算基础设施。它把分散在不同地理位置的资源虚拟成为一个空前强大的信