论文部分内容阅读
信息技术和互联网的飞速发展使得人们可以更好地享受各类视频信息,如:有线电视、交互式网络电视、蓝光光盘等。为了节约这些视频信息的存储空间及网络传输带宽,国内外的科研机构和工业界早已开展对视频压缩技术的研究。至今,国际国内都已经制定一系列市场前景良好的视频编码标准。与之前的视频编码标准相比,每个后起之秀在压缩性能上都有较大的提升,如目前主流的H.264/AVC标准的压缩性能比以往的任何标准都提高了一倍以上。但是,由于消费者对标清、高清视频和交互式视频服务的质量要求越来越高,开发更加高效的视频压缩技术的重要性也日益凸现。视频压缩系统中预测误差编码效率在很大程度上决定了整个系统的性能,因此如何对预测误差信号进行更加高效的编码已经引起人们越来越多的关注。本文的工作围绕视频压缩中预测误差编码的关键技术进行开展。视频压缩系统中往往采用基于块的预测方法,视频图像内部纹理的不同导致预测误差块的内部相关性强弱也各不相同。但是,传统的用于去除内部冗余的DCT变换技术只对相关性较强的误差块有效。因此,需要根据预测误差块内部相关性强弱采取不同的编码策略。接着,经过变换/量化后的变换系数应该依据其局部特性进行自适应重组,形成有利于熵编码压缩的一维输入序列。最后,对进入熵编码器的一维序列,需要设计高效的上下文模型以更好地去除输入序列的统计冗余。本文研究的目标就是提供一种针对预测误差的新颖、高效、低复杂度的编码方法,并将相关技术贡献于我国AVS音视频编码标准。主要内容包括:
[1]低复杂度的空域/频域自适应FGS编码方法
视频压缩系统中的帧间图像编码往往采用基于块的变换技术来去除预测误差块中像素之间的相关性。但是,预测误差块的内部相关性可能较弱,所以变换技术并不总是十分有效。FGS层帧间图像的编码过程也存在同样的问题。一个很好的解决方法就是对预测误差内部相关性较弱的块舍弃变换操作。本文首先对FGS层预测误差的内部相关性进行分析。在此基础上,本文提出了一种低复杂度的空域/频域自适应FGS编码方法。本算法可以根据基本层相同位置变换系数块的1-范数的值决定FGS层的预测误差在空域或频域进行编码。空域编码的预测误差块可以省去变换操作。这样,FGS层的预测误差块可以自适应地选择在空域或频域上进行编码。其次,针对在空域进行编码(相关性较弱)的预测误差块,本文设计出一种率失真意义下最优的空域量化器。同时,空域系数的熵编码方法与频域系数的熵编码方法也有所不同。本文提出的方法在获得更高的编码性能的同时也可以有效降低编解码器的计算复杂度,这是因为空域编码的预测误差块不需要进行反变换操作。
[2]宏块级变换系数自适应重组算法
不管是空域或频域编码,这些经过基于块的预测、变换/量化操作得到的变换系数进入熵编码模块之前都需要进行重组。传统的视频编码方法往往采用zig-zag扫描模板对变换系数进行重新排列,然后进入熵编码模块进行数据压缩。但是zig-zag模板仅适用于变换系数沿水平、垂直方向对称分布的情况,而变换系数分布往往具有多变特性。因此对所有宏块都采用固定的zig-zag模板进行系数重排不总是十分有效。本文首先对变换系数的分布特性进行分析,在此基础上引入两种新的无需存储的扫描模板。这样,每个宏块可以依据变换系数的局部分布特性利用率失真优化策略自适应地选择扫描模板。这种宏块级自适应重组算法可以使得重组后的一维序列更有利于后续的熵编码模块对数据进行压缩,因而可以有效地提高编码性能。但是,扫描模板的率失真决策过程也增加了编码器的计算复杂度。为了进一步降低编码器的计算复杂度,本文还提出了一种基于代价函数的快速模板决策算法。该代价函数定义为宏块内所有非零系数的扫描序号之和。此方法与基于率失真优化的变换系数自适应重组算法的编码性能相当,但是其复杂度有很大程度的降低。
[3]基于上下文的二元算术编码方法
本文在对变换系数的统计特性进行分析的基础上,提出了一种新型的基于上下文的二元算术编码方法,并逐一深入地介绍了该算法的技术细节,如二值化过程、上下文模型设计与量化方法及上下文加权技术。该方法按照与(Level, Run)数对生成时“相反”的顺序依次对各数对进行编码,这一逆扫描序的编码顺序可以显著提高上下文模型的有效性。同时,该方法利用本系数块中所有已完成编码的(Level,Run)数对构造上下文,这样算术编码器可以利用少数几个上下文模型来去除高阶马尔可夫过程中的冗余性。同时,该方法创新性地使用了上下文加权技术,通过将多个上下文模型融合为一体来进一步改进压缩性能。此外,本算法采用一种创新性的上下文量化方法,实现了利用较少的上下文状态数刻画高阶马尔可夫模型,从而避免遭受上下文稀释问题的不良影响。最重要的是,本算法在达到上述目的时相对现有技术并没有增加计算复杂度,适合实时应用,并且与AVS-P2基准视频编解码框架具有兼容性。该技术已经被AVS-P2 Jiaqiang和Zengqiang档次所采纳。
本文对预测误差编码的三大关键技术:变换/量化、变换系数重组以及熵编码分别进行研究,实现了对预测误差的高效编码,可以认为是对视频压缩中预测误差编码技术的一种有益的探索。