论文部分内容阅读
随着网络通信、移动通信和网络在线音频技术的快速发展,传统的固定速率语音与音频编码由于编码模型的限制,并不适用于时变的通信信道。嵌入式编码作为变速率编码的一种,可以很好地应对这些问题,因此它逐渐成为了现阶段语音频编码研究的热点问题。
基于此背景,2005年ITU-T第16工作组提出了G.EV-VBR嵌入式宽带编码提案,并于2007年7月对其功能进行扩展,提出了一个以G.729.1和G.EV-VBR为核心的超宽带编码提案,目前多家研究机构参与了该项标准的竞争。
本文正是针对此标准的制定展开工作,通过对现有的编码技术进行深入研究,提出了几种嵌入式的语音频编码算法,并最终实现了一套满足ITU-T指标要求的8~64kb/s超宽带嵌入式编码算法。
本文的主要成果体现为如下几个方面:
1.研究现有的嵌入式编码技术,提出了一种以G.729.1为核心编码器的超宽带嵌入式编码结构;
2.将用于散布脉冲位置编码的阶乘脉冲编码技术引入频域系数编码中,通过量化由MLT系数构成的低维矢量,实现了一种带宽升级的嵌入式编码算法;
3.为了进一步优化编码比特分配,提高量化效率,提出了基于人耳绝对听觉掩蔽特性的感知排序方法,用以控制编码比特的分配和码流的分层,从而实现一种量化精度升级的超宽带嵌入式编码方法,该方法保证了新增码率下解码信号的有效带宽均为14kHz;
4.针对低码率下丢失谱线的恢复问题,提出了一种基于修正谱熵分类的频谱线性插值方法,本方法可根据谱信息将信号分为类噪声和类谐波两类,不同类型信号选取不同的插值函数和衰减因子来恢复丢失的频域系数,对于类噪声信号本方法可有效地保证其高频谱能量的平滑,同时,对于类谐波信号可避免出现因系数填充不当而引入量化噪声的情况;
5.基于位平面分层和矢量哈夫曼编码技术,提出了一种量化精度升级的嵌入式编码算法,本套算法分层方法灵活,可根据实际码率要求结合人耳听觉模型自适应地进行位平面分层量化。该方法经ITU-T认证的北京理工大学通信技术研究所进行标准化评测,测试结果表明,在各码率下的编码质量均达到了ITU-T提出的指标要求;
6.采用M/S技术和嵌入式MLT变换编码技术,提出了一种嵌入式的立体声编码算法,本方法在各码率下对立体声信号的编码质量均不次于ITU-T给定的参考编码器,尤其是对于左、右声道具有较强相关性的立体声信号,编码效果尤
7.对主成分分析方洼进行研究,提出了一种MLT系数压缩采样方法,实现了数据降维后信号的主观无失真重建,同时结合此方法提出了一种嵌入式立体声参数编码方法。该编码方法有效地保留了立体声信号的空间感知特性,对于左右声道相关性较弱的立体声信号具有非常好的编码质量。