论文部分内容阅读
现今,人们对视觉和听觉质量的不断追求,导致了计算机、电子、通讯技术的迅速发展,作为诸多计算机研究领域中最为活跃研究邻域之一的多媒体视频编码技术也随着应用的需求不断发展着。随着电影《阿凡达》的热映,人们被3D场景的逼真效果所吸引,由此带动了如3D电影、3D电视、3D动画等很多相关产业的发展,多视点视频编码技术(MVC)作为该产业的基础越来越受到人们的重视。由于网络带宽的有限性,视频编码技术一直在追求低码率和高的编码效率。多视点视频指的是对同一场景从多个角度同时拍摄得到的多个视频序列,由此可见,MVC编码的数据量是非常大的,因此,如何有效的对多视点视频进行压缩就显得至关重要。目前,由HHI提出的分层的B帧预测结构在MVC中得到了广泛的应用,该结构在原有的运动估计基础上增加了视间估计,取得了较好的编码效率,但增加了编码的复杂度,因此,要想对多视点视频进行实时的传输应用就需要降低编码的复杂度。本文的重点在于对MVC中的快速算法进行研究,同时又对其中技术做了深入研究并应用到了Direct模式中。3D视频作为2D视频的扩展能够提供给用户直观的深度感受,2D纹理+深度的表示方式已经应用在3D电视和自由点电视中,由此可见,深度图作为一种辅助信息在MVC编码标准中已经被允许由编码端传输到解码端辅助虚拟视点和3D场景的绘制。本文快速算法的思想就是利用深度图参与的3D warping变换技术重新确定视间估计过程的搜索起始点,减小搜索范围,加快MVC中的视间估计过程,以其达到减小编码复杂度的目的,实验结果显示,提出的新算法能够在编码效率很小损失的情况下大概平均节省了MVC中45%的编码时间。本文又将3D warping变换技术做了进一步应用,扩展到了MVC中的Direct模式中。Direct模式中的运动信息不用传输,是由相邻宏块推导而出,我们用3D warping变换技术估计出的视间矢量取代由相邻宏块估计得到的视间矢量,以其提高Direct模式的估计准确度,最终目的提高编码效率,实验结果表明,该方法对某些视频序列在保持原有编码效率的基础上略有增加。