论文部分内容阅读
多视点视频是由摄像机阵列在同一时刻从不同角度对同一场景进行拍摄得到的一组视频序列。它包含丰富的3D信息,具有立体感和交互性,能够提供给观众不同角度的场景信息使观众有身临场景的视觉体验。多视点视频可以应用于3D电视,自由视点电视等方面。 多视点视频巨大的数据量增加了数据处理、存储和传输的困难。因此,多视点视频编码技术成为多视点视频研究中的重要内容。目前,JVT(Joint Video Team)针对多视点视频编码制定的标准MVC(Multi-view Video Coding)是H.264/AVC标准的扩展,包含了H.264/AVC相关技术,并采用HHI提出的分层B帧时间/空间预测结构。MVC具有较高的压缩效率,但是编码复杂度较高。 本文重点研究了MVC中的预测结构和宏块预测模式选择两项内容。在保证编码效率的情况下,降低MVC的编码复杂度,减少编码时间,使MVC能够适应多视点视频实时应用系统。本文的主要工作如下: 1.介绍了多视点视频和视频编码相关内容,包括多视点视频系统组成结构,多视点视频编码所要达到的功能要求,预测编码的原理和视频编码标准发展历程。此外还介绍了MVC编码框架以及H.264/AVC中的几项关键技术。 2.研究预测结构。重点介绍了MVC中采用的分层B帧时间/空间预测结构,描述了它的编码预测关系,编码性能等。该结构需要时间、视点间联合预测,编码复杂度较高。本文取消了该结构中部分图像视点间的预测关系,降低编码复杂度,同时为了保证编码效率,做出了改变基本视点位置和时间方向预测关系两项改进。实验结果表明,和参考预测结构相比,改进后的预测结构能够减少编码时间,并且对编码效率没有明显影响。 3.研究宏块预测模式选择。重点介绍了MVC中宏块预测模式类型,各种类型的特点以及率失真代价函数。分析了MVC中宏块预测模式选择方案。该方案需要遍历所有宏块预测模式,然后选择率失真代价值最小的模式作为编码模式,编码复杂度较高。本文分析了编码时各预测模式的分布比重,Skip预测模式和图像运动程度的关系,提出利用邻近视点图像运动程度来判定当前视点宏块预测模式,跳过搜索其他预测模式,降低编码复杂度。实验结果表明,改进后的方案能够显著减少编码时间,并且对编码效率没有明显影响。 最后总结了全文所做工作,并简单介绍了多视点视频编码在今后工作中值得研究的方面。