论文部分内容阅读
无损音频压缩是指在不损失任何音频信息的前提下实现压缩。目前的有损编码标准虽能提供良好的主观音质和高压缩比,但对于动态范围较大的音乐、具有高质量要求的演播室或者音乐厅环境中、以及具有二次编码要求的音频编辑应用中,有损编码无法满足质量要求。而无损编码能达到真正的透明音质,且在不同的无损格式之间相互转化不丢失任何音频信息,因而研究具有高压缩比的无损音频压缩算法具有重要的理论意义和实用价值。
本文设计了基于整数改进离散余弦变换(IntMDCT)的无损音频压缩算法,输入音频数据首先进行分帧加窗,然后进行IntMDCT,变换后的系数经映射后进行Golomb-Rice熵编码,同时论文设计了相应的比特流结构,实验结果表明本文提出的无损音频压缩算法具有良好的压缩性能。
改进型离散余弦变换(MDCT)技术在音频压缩中广泛使用,但由于传统MDCT基于浮点算法设计,在定点实现时由于存在截断误差而无法实现完全可逆。因此本论文研究整数MDCT(IntMDCT)以实现真正可逆变换并将之用于无损音频压缩。论文证明了MDCT分解为Givens旋转和DCT的推导过程,在此基础上使用两种提升方案――“经典提升”和“多维提升”实现IntMDCT。同时论文对IntMDCT中复杂的矩阵运算提出了相应简化算法,降低了算法实现的复杂度。
为了便于编码,本文对变换后的系数进行了映射处理,并在大量统计分析的基础上,发现经过映射后的IntMDCT系数的概率分布接近于几何分布,因此算法中采用了Golomb-Rice熵编码技术,并且达到较好的编码性能。由于不同频段内变换系数的幅度差异,本论文对于不同频段的变换系数采用了不同的Golomb-Rice编码参数以得到最优的压缩效率。
论文同时设计了适合于该无损音频压缩算法的比特流结构,并实现了该无损音频编解码算法,分析了采用两种提升实现IntMDCT相对于浮点变换结果的逼近误差,以及对于整个算法压缩性能的影响。论文最后对算法的压缩效率、鲁棒性和复杂度等性能进行分析。对SQAM中70个测试曲目编码的实验结果表明,本算法的平均压缩比为3.17,具有较高的压缩效率;并且本算法具有较好的鲁棒性和较低的复杂度。