基于运动分析的视频图像深度信息获取方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:majun913
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现代电影电视技术的发展不断给人们带来更新更好的视听体验。伴随着3D显示技术和3D电影的成功,以及人们对3D体验的热衷,3D视频产业也逐渐备受关注。然而,3D视频的拍摄对资源和时间的消耗较大,现有拍摄的立体视频资源相对匮乏。相比之下,高质量的2D视频资源丰富,将这些2D视频转换成3D视频将可以大大地弥补3D视频的不足,促进并有助于3D电影电视等相关行业的发展与进步。将2D的视频转化为3D视频,需要补充2D场景的景深信息,即获取2D视频帧图像对应的深度图,再利用DIBR(Depth Map Based Rendering)的技术生成3D呈像需要的左右视图。本文主要探讨了从二维的视频帧图中,利用运动分析的结果和参数,提取出深度信息的途径。首先,以光流场的灰度梯度方程为基础,使用金字塔分割的方式提高估计精度,并且在计算灰度梯度时引入运动参量,采用迭代逼近的方法求解模型约束,获得运动场;再根据相位梯度方程,采用Gabor滤波器组提取相位信息,估计出另一个运动场,二者综合。然后,对场景分割,分别使用边沿检测和区域生长的方法,根据分割信息对物体区域内部进行运动矢量的平滑处理。其次,利用人眼易于将快速运动物体识别为前景和物理尺度随着与摄像机的远离而缩小的特性,将速度越快的物体设置为更近的景深,从而获得深度图。最后,对深度图进行直方图均衡化,并采用形态学的方法对深度图进行滤波,提高深度图的质量。二维视频的深度信息提取技术具有广阔的发展和应用前景。它以人类的立体视觉特性为基础,从2D场景中利用现代图像处理的技术提取景深信息。本文利用场景的运动信息提取出深度信息,并通过实验验证了利用运动信息获取深度信息的可行性,取得了较好的实验结果。
其他文献
在现代电子设备中,印刷电路板PCB发挥着越来越重要的作用,其质量的好坏在一定程度上决定了电子产品的性能。因此,PCB缺陷检测在工业生产中具有极其重要的价值。基于自动光学
随着信息产业的飞速发展,通信网络、广播电视网络与IP网络三网融合进程的快速推进,多媒体业务正成为网络的主要业务之一。多媒体业务数据传输量大,如何有效地利用信道带宽,成为运
网络多媒体技术、通信技术和传输技术的迅速发展给人们带来极大的便利的同时,信息安全成为人们不容忽视的问题。而无线网络因为其特殊的性质,安全问题尤其突出。加密哈希函数
结构化LDPC(Low-Density Parity-Check,LDPC)码是一种逼近香农限的实用好码,工程中通常用结构化的方法进行构造。而准循环LDPC(Quasi-Cyclic LDPC,QC-LDPC)码因为其校验矩阵
喉振式话筒是放置在喉部附近的皮肤振动传感器,是一种典型的非空气传导语音的设备。由于它采集不到外界空气传播的噪声,它被广泛应用于各种强噪声环境下的语音采集。但由于喉
超高频RFID技术读写距离远、读写速度快,是目前的研究热点之一。从系统角度展开对超高频RFID技术的数据传输研究,有利于从整体上改善系统性能。本文在对ISO/IEC18000协议数据传
医学图像聚类就是把图像中的不同物质依据某种属性聚集成类,并使得类内相似性尽量大,类间相似性尽量小的一种图像分析方法,具有重要的临床应用价值。近年来,随着影像学诊断应
图像分割是图像处理和图像分析中的关键步骤,分割的目的是提取图像有意义的区域。图像分割问题的典型定义就是如何在图像处理过程中将图像中的一致性区域和感兴趣对象提取出
随着说话人识别技术的发展,说话人识别系统的性能已经达到实用的水平,例如在2010年NIST的说话人识别评测中,核心测试的等错误率达到1%左右。然而在实用环境中,说话人识别系统将会
近年来,对海洋的开发与利用引起了各国重视,水声通信也因此得到了越来越高的关注并朝着高速、移动、组网的方向发展。受恶劣海洋环境影响,水声通信系统具有高时延、低码率、