论文部分内容阅读
随着互联网的普及和图像应用范围的不断扩大以及数字图像和视频数据的海量性,使人们一直热衷于数字编码技术的研究,经过了几十年的发展过程,以三大经典编码算法为基础的第一代编码技术以发展到了极限。以考虑人的视觉、生理为特点的第二代编码技术,将数字编码研究扩展到一个新的领域,小波变换是第二代编码技术的里程碑,它以广泛应用于图像纹理分析、图像编码、计算机视觉、语音识别、地震信号处理等领域。S.G.Mallat在1986年将计算机视觉领域内的多分辨率分析的思想巧妙的引入到小波分析中,统一了在此之前各种小波基的构造方法,并给出了一种子带滤波器结构的离散小波变换与重构算法。在空间域里,小波分解将信号分解为不同层次,每一层次的分辨率不同。由于小波分解方法本身的正交性,分解后不同层次数据之间的相关性完全由数据本身的相关性决定。排除了由于分解方法内在的相关性而造成数据之间呈现相关性的混淆。小波变换在空间域中进行多层次分解运算的同时形成了频率域中的多层次分解。在频率域中的每个层次上,高频分量与低频分量的分布与原数据中频率分布的方向有关。小波分解后的数据,能量被按频率分解为不同的区域。其中低频表示的是原图像中的主要信息,对图像的恢复具有重要价值,低频信息的失真会导致整个图像重构的失真,严重影响图像质量。本文采取的策略是对低频采取预测差分编码,可以达到无损压缩。细节信息主要集中在高频分量中。不同分辨率下,同一空间位置处的小波系数表示的是同一物体的细节信息,具有自相关性,适合嵌入式编码。嵌入零树小波编码方法是按位平面分层进行孤立系数和零树的判决和熵编码,而判决阈值则逐层折半递减。在嵌入零树小波编码(EZW)中引入了字符的概念,它是用来表述每一个小波系数状态的字符表示。 <WP=46>零树根(ZTR):在本次量化中,该小波系数的幅值小于给定的阈值T,并且它的子孙后代中的任何一个的幅值都比这个给定的阈值要小。同时,还要求该系数的父节点系数的幅值大于本次量化的幅值T。负大系数(NEG):在本次量化中,该小波系数的幅值大于给定的阈值T,但是,它的最高位是1,即它实际的值是一个负数。正大系数(POS):在本次量化中,该小波系数的幅值大于给定的阈值T,但是,它的最高位是0,即它实际的值是一个正数。孤独零(IZ):在本次量化中,该小波系数的幅值小于给定的阈值T。但是,它的子孙后代中至少存在一个系数的幅值比这个给定的阈值T要大,也就是说,该小波系数的子孙后代中存在有大系数(无论它是正的还是负的),该系数的父节点的幅值可以为任意值。一副经过小波变换的图像按其频带从低到高形成一个树状结构,其中最低频部分采用了预测差分编码,其余部分按照上述定义的符号进行零树预测。在编(译)码过程中,始终保持着两个分离的列表:主表和辅表。主表对应于编码中的不重要的集合或系数,其输出信息起到了恢复各重要值的空间位置结构的作用,而辅表是编码的有效信息,输出为各重要系数的二进制值。编码分为主、辅两个过程:在主过程中,设定阈值为Ti,按上述原理对主表进行扫描编码,若是重要系数,则将其幅值加入辅表中,然后将该系数在数组中置为零,这样当阈值减小时,该系数不会影响新零树的出现;在辅过程中,对辅表中的重要系数进行细化,细化过程类似于比特平面编码。对阈值Ti来说,重要系数的所在区间为[Ti,2Ti],若辅表中的重要系数位于[Ti,3Ti/2],则用符号“0”表示,否则用符号“1”表示。编码在两个过程中交替进行,在每个主过程前将阈值减半,直到阈值接近0。但是,由于小波变换具有良好的去相关性,低频子带小波系数与高频子带小波系数之间的相关性已经很弱,同时,低频分量的能量较大,系数幅值比各高频分量的系数幅值要高许多,并且,随着分解层数的增加,低频<WP=47>分量系数的幅值会越来越大,能量也越来越集中。本文认为,小波分解后的低频系数不适宜使用非重要系数预测算法进行压缩处理,提出了在原有小波零树压缩编码的基础上,对低频系数和高频系数采用不同的压缩方法,得出了一个新的压缩方案,该方案对低频系数采用DPCM压缩,而高频子带使用零树算法进行压缩。预测编码根据过去已经编码的像素(也称为参考像素)来预测当前的像素值(称为预测值),然后对当前的像素值与预测值之差进行编码,这就是差分脉冲调制编码(DPCM)。由于差值小,编码所需比特数可减少很多。这是利用像素与像素之间的信息冗余度来进行编码的一种数据压缩技术。本文将小波变换与预测差分编码相结合,使得图像的编码同时具有两者的优点。并对上述算法进行了详细的介绍。