视频压缩中预测误差的高效编码技术研究

来源 :中国科学院计算技术研究所 | 被引量 : 0次 | 上传用户:lwsun_2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息技术和互联网的飞速发展使得人们可以更好地享受各类视频信息,如:有线电视、交互式网络电视、蓝光光盘等。为了节约这些视频信息的存储空间及网络传输带宽,国内外的科研机构和工业界早已开展对视频压缩技术的研究。至今,国际国内都已经制定一系列市场前景良好的视频编码标准。与之前的视频编码标准相比,每个后起之秀在压缩性能上都有较大的提升,如目前主流的H.264/AVC标准的压缩性能比以往的任何标准都提高了一倍以上。但是,由于消费者对标清、高清视频和交互式视频服务的质量要求越来越高,开发更加高效的视频压缩技术的重要性也日益凸现。视频压缩系统中预测误差编码效率在很大程度上决定了整个系统的性能,因此如何对预测误差信号进行更加高效的编码已经引起人们越来越多的关注。本文的工作围绕视频压缩中预测误差编码的关键技术进行开展。视频压缩系统中往往采用基于块的预测方法,视频图像内部纹理的不同导致预测误差块的内部相关性强弱也各不相同。但是,传统的用于去除内部冗余的DCT变换技术只对相关性较强的误差块有效。因此,需要根据预测误差块内部相关性强弱采取不同的编码策略。接着,经过变换/量化后的变换系数应该依据其局部特性进行自适应重组,形成有利于熵编码压缩的一维输入序列。最后,对进入熵编码器的一维序列,需要设计高效的上下文模型以更好地去除输入序列的统计冗余。本文研究的目标就是提供一种针对预测误差的新颖、高效、低复杂度的编码方法,并将相关技术贡献于我国AVS音视频编码标准。主要内容包括:   [1]低复杂度的空域/频域自适应FGS编码方法   视频压缩系统中的帧间图像编码往往采用基于块的变换技术来去除预测误差块中像素之间的相关性。但是,预测误差块的内部相关性可能较弱,所以变换技术并不总是十分有效。FGS层帧间图像的编码过程也存在同样的问题。一个很好的解决方法就是对预测误差内部相关性较弱的块舍弃变换操作。本文首先对FGS层预测误差的内部相关性进行分析。在此基础上,本文提出了一种低复杂度的空域/频域自适应FGS编码方法。本算法可以根据基本层相同位置变换系数块的1-范数的值决定FGS层的预测误差在空域或频域进行编码。空域编码的预测误差块可以省去变换操作。这样,FGS层的预测误差块可以自适应地选择在空域或频域上进行编码。其次,针对在空域进行编码(相关性较弱)的预测误差块,本文设计出一种率失真意义下最优的空域量化器。同时,空域系数的熵编码方法与频域系数的熵编码方法也有所不同。本文提出的方法在获得更高的编码性能的同时也可以有效降低编解码器的计算复杂度,这是因为空域编码的预测误差块不需要进行反变换操作。   [2]宏块级变换系数自适应重组算法   不管是空域或频域编码,这些经过基于块的预测、变换/量化操作得到的变换系数进入熵编码模块之前都需要进行重组。传统的视频编码方法往往采用zig-zag扫描模板对变换系数进行重新排列,然后进入熵编码模块进行数据压缩。但是zig-zag模板仅适用于变换系数沿水平、垂直方向对称分布的情况,而变换系数分布往往具有多变特性。因此对所有宏块都采用固定的zig-zag模板进行系数重排不总是十分有效。本文首先对变换系数的分布特性进行分析,在此基础上引入两种新的无需存储的扫描模板。这样,每个宏块可以依据变换系数的局部分布特性利用率失真优化策略自适应地选择扫描模板。这种宏块级自适应重组算法可以使得重组后的一维序列更有利于后续的熵编码模块对数据进行压缩,因而可以有效地提高编码性能。但是,扫描模板的率失真决策过程也增加了编码器的计算复杂度。为了进一步降低编码器的计算复杂度,本文还提出了一种基于代价函数的快速模板决策算法。该代价函数定义为宏块内所有非零系数的扫描序号之和。此方法与基于率失真优化的变换系数自适应重组算法的编码性能相当,但是其复杂度有很大程度的降低。   [3]基于上下文的二元算术编码方法   本文在对变换系数的统计特性进行分析的基础上,提出了一种新型的基于上下文的二元算术编码方法,并逐一深入地介绍了该算法的技术细节,如二值化过程、上下文模型设计与量化方法及上下文加权技术。该方法按照与(Level, Run)数对生成时“相反”的顺序依次对各数对进行编码,这一逆扫描序的编码顺序可以显著提高上下文模型的有效性。同时,该方法利用本系数块中所有已完成编码的(Level,Run)数对构造上下文,这样算术编码器可以利用少数几个上下文模型来去除高阶马尔可夫过程中的冗余性。同时,该方法创新性地使用了上下文加权技术,通过将多个上下文模型融合为一体来进一步改进压缩性能。此外,本算法采用一种创新性的上下文量化方法,实现了利用较少的上下文状态数刻画高阶马尔可夫模型,从而避免遭受上下文稀释问题的不良影响。最重要的是,本算法在达到上述目的时相对现有技术并没有增加计算复杂度,适合实时应用,并且与AVS-P2基准视频编解码框架具有兼容性。该技术已经被AVS-P2 Jiaqiang和Zengqiang档次所采纳。   本文对预测误差编码的三大关键技术:变换/量化、变换系数重组以及熵编码分别进行研究,实现了对预测误差的高效编码,可以认为是对视频压缩中预测误差编码技术的一种有益的探索。
其他文献
目前,我国的电力设计行业在项目管理中还存在很多问题,其中最关键的问题就是工程设计流程不够完整和规范。对电力设计流程进行规范化建模和分析是提高电力设计效率的关键。Petr
近些年来,各种信息处理系统和互联网快速发展,大量的数据随之产生。如何从这些数据中发现有用的知识就变得非常重要,因此,数据挖掘在近些年是热点研究领域。而在数据挖掘研究中,聚
在开放的互联网环境中,面向服务的计算(Service-Oriented Computing,SOC)和面向服务的体系架构(Service-Oriented Architecture,SOA)使得信息资源和软件系统的主要形态发生了巨
增强现实技术(Augmented Reality)是指将计算机产生的虚拟对象放置到反映真实世界的场景空间中,并对真实世界起到补充,增强的作用的一种新兴技术。本文提出了一种可应用于机器
网络信息抽取是指从半结构化的html网页中,抽取出正文、作者、时间等关键信息。网络信息抽取是包括搜索引擎、舆情系统、推荐系统等在内的数据分析系统的基础支持技术,用于从采
P2P网络具有很高的可扩展性、自治性和容错性,能充分利用个人电脑的网络带宽、存储空间以及计算资源,为构建文件共享和存储系统提供了非常有利的条件。但由于系统用户具有高度
市场全球化的趋势使得市场竞争日益激烈,跨行业、跨区域的企业制造模式已经逐渐形成。作为一种跨平台、网络化、服务于企业的企业建模和管理工具,ERP(企业资源计划)的概念于1990
H.264是目前最新的视频压缩编码标准,编码效率是MPEG-2的2~3倍,广泛应用于在通讯、计算机、消费电子等领域。同时,与之前的MPEG-1/2和H.263标准相比较,H.264的算法复杂度也大幅增
近年来,基于分布式对等(Peer-to-Peer)系统在互联网上广泛的流行起来,成为了当前占据Internet主要流量之一。基于分布式散列表(Distributed Hash Table,DHT)的结构化P2P系统是P2P领
服务建模是当今软件工程领域的热点研究方向之一。为了支持面向服务的软件系统开发,本文论述了如何基于《CBDI-SAETM Meta Model foz SOA2.0》服务建模语言规范进行服务建模。