论文部分内容阅读
融合深度信息的多视点视频是目前最有效的三维视频表示形式,能够在一定范围内重建任意视角的三维视频图像,呈现出更具立体感和真实感的场景。随着视频应用领域的不断拓宽,具有临场感和交互性的多视点视频编码及应用技术在学术界和工业界受到了更加广泛的关注,已成为多媒体信息处理领域极为热点的研究课题之一。然而,由于多视点视频蕴含庞大的数据量,必须采用有效的视频压缩与传输技术,才能满足高效网络传输与应用需求。国际视频编码联合工作组制定的基于高效视频编码的3D视频编码(3D-HEVC)标准以获得更高的压缩比和更好的网络适应性为目标,已作为新一代3D视频编码标准于2015年2月发布。本论文重点研究多视点视频编码与码率控制技术,针对最新的3D视频编码国际标准3D-HEVC,从提高多视点视频编码速度与准确进行码率控制两个方面开展深入研究,主要研究内容及研究成果如下:1.综述了HEVC视频编码框架的基本原理及关键编码技术,并对基于HEVC的多视点视频编码技术及码率控制技术进行总结;分析了两种主流的多视点视频编码框架并进行性能比较,选取编码性能较好的3D-HEVC编码框架作为本文采用的多视点视频编码框架。2.提出一种多视点视频纹理图帧间预测编码模式快速判决算法,有效提高了多视点视频纹理图的编码速度。通过分析多视点视频序列中相邻视点间和四叉树编码块划分结构中相邻划分深度间编码模式的相关性,分别针对B帧和P帧设计合并模式快速判决算法,预判采用合并模式编码的编码单元(CU),并提出合并-跳过模式快速判决算法,基于初次编码模式判决结果进一步判定采用合并模式或合并-跳过模式编码的CU,跳过不必要的预测编码模式遍历过程。实验结果表明,该算法能够在保证率失真性能损失很小的前提下,显著降低多视点视频纹理图的编码复杂度。3.通过设计率失真与编码参数相融合的优化模型,将目标码率与编码参数相关联,提出一种多视点视频纹理图最大尺寸编码单元(LCU)层码率控制算法,提高了码率控制的准确性。设计比特分配策略优化方法及制定率失真模型参数预测初值选取规则,将时间方向和视点方向参考帧的平均绝对误差(MAD)作为参考,利用MAD预测误差自适应地为不同预测方向分配权重,获得可靠的目标码率及模型参数预测初值,并通过探索模型参数预测初值、目标码率与编码参数?之间的相互关系,提出融合双向参考帧预测的R-?优化模型,实现对多视点视频纹理图的码率控制。实验结果证明,该算法能够在保证同等码率准确度的前提下提高率失真性能,同时增强码率波动的平滑性。