多视点视频编码中快速算法的研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:seayi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现今,人们对视觉和听觉质量的不断追求,导致了计算机、电子、通讯技术的迅速发展,作为诸多计算机研究领域中最为活跃研究邻域之一的多媒体视频编码技术也随着应用的需求不断发展着。随着电影《阿凡达》的热映,人们被3D场景的逼真效果所吸引,由此带动了如3D电影、3D电视、3D动画等很多相关产业的发展,多视点视频编码技术(MVC)作为该产业的基础越来越受到人们的重视。由于网络带宽的有限性,视频编码技术一直在追求低码率和高的编码效率。多视点视频指的是对同一场景从多个角度同时拍摄得到的多个视频序列,由此可见,MVC编码的数据量是非常大的,因此,如何有效的对多视点视频进行压缩就显得至关重要。目前,由HHI提出的分层的B帧预测结构在MVC中得到了广泛的应用,该结构在原有的运动估计基础上增加了视间估计,取得了较好的编码效率,但增加了编码的复杂度,因此,要想对多视点视频进行实时的传输应用就需要降低编码的复杂度。本文的重点在于对MVC中的快速算法进行研究,同时又对其中技术做了深入研究并应用到了Direct模式中。3D视频作为2D视频的扩展能够提供给用户直观的深度感受,2D纹理+深度的表示方式已经应用在3D电视和自由点电视中,由此可见,深度图作为一种辅助信息在MVC编码标准中已经被允许由编码端传输到解码端辅助虚拟视点和3D场景的绘制。本文快速算法的思想就是利用深度图参与的3D warping变换技术重新确定视间估计过程的搜索起始点,减小搜索范围,加快MVC中的视间估计过程,以其达到减小编码复杂度的目的,实验结果显示,提出的新算法能够在编码效率很小损失的情况下大概平均节省了MVC中45%的编码时间。本文又将3D warping变换技术做了进一步应用,扩展到了MVC中的Direct模式中。Direct模式中的运动信息不用传输,是由相邻宏块推导而出,我们用3D warping变换技术估计出的视间矢量取代由相邻宏块估计得到的视间矢量,以其提高Direct模式的估计准确度,最终目的提高编码效率,实验结果表明,该方法对某些视频序列在保持原有编码效率的基础上略有增加。
其他文献
立体视觉作为计算机视觉中的一个重要分支,一直是计算机视觉研究的重点和热点之一。立体匹配是立体视觉中的一个难题,是当前制约立体视觉发展的瓶颈问题。由于外极线约束是立
近年来,我国旅游业发展迅速,旅游已成为国民经济发展中的一个重要因素,特别是对于像贵州省这类旅游资源丰富、少数民族聚居的地域。随着旅游资源不断丰富,人们对于旅游服务和旅游
联盟环境是由不同的相互信任的域共同构成的资源共享平台。在联盟环境中,每个域都设置有认证服务器,一方面对本域资源的安全访问进行管理,另一方面为用户提供认证服务。由于
生物医学研究是二十一世纪最受关注的研究领域之一,尤其随着生物医学研究在分子层面的展开,人类基因组计划的实施完成,产生了海量的生物医学数据,并形成了数以百计的生物医学
计算机技术和网络技术的飞速发展,一方面促进了数字作品传播;另一方面给版权保护带来了挑战。作为一种特殊的数字作品,数字地图正遭受非法侵权问题的困扰。数字水印作为有效的
随着经济的发展,大量的人们热衷于股票、债券、基金等金融领域的投资,如何及时准确获取有关金融领域的信息便成了投资者们十分关心的一个话题。随着计算机网络的发展,论坛作为In
近年来,随着互联网和多媒体共享社区的发展,尤其是Flickr、YouTube等新兴社区的快速发展,多媒体内容的规模正成爆炸式增长。如何有效、准确的对这些内容进行管理、检索变得尤
本文涉及的研究领域是无穷状态系统的验证。无穷状态系统上的验证问题主要包括两个方面:一个方面是等价验证,另一个方面是模型检测。等价验证主要是给定两个无穷状态系统,判
随着信息技术的快速发展,电子政务系统中的非法访问和越权操作等安全性问题日益严重,亟待解决。PKI技术为电子政务系统提供了强有力的身份认证服务,但不能有效地解决在身份认证
专用通信网是一种同时包含有线链路和无线链路的多层树状通信网络。分析了专用通信网的网络拓扑特点及其与Ad hoc网络的异同,对常用的地面网和Ad hoc网络路由协议进行了广泛