基于变换的无损音频压缩算法设计

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:quakerb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
无损音频压缩是指在不损失任何音频信息的前提下实现压缩。目前的有损编码标准虽能提供良好的主观音质和高压缩比,但对于动态范围较大的音乐、具有高质量要求的演播室或者音乐厅环境中、以及具有二次编码要求的音频编辑应用中,有损编码无法满足质量要求。而无损编码能达到真正的透明音质,且在不同的无损格式之间相互转化不丢失任何音频信息,因而研究具有高压缩比的无损音频压缩算法具有重要的理论意义和实用价值。 本文设计了基于整数改进离散余弦变换(IntMDCT)的无损音频压缩算法,输入音频数据首先进行分帧加窗,然后进行IntMDCT,变换后的系数经映射后进行Golomb-Rice熵编码,同时论文设计了相应的比特流结构,实验结果表明本文提出的无损音频压缩算法具有良好的压缩性能。 改进型离散余弦变换(MDCT)技术在音频压缩中广泛使用,但由于传统MDCT基于浮点算法设计,在定点实现时由于存在截断误差而无法实现完全可逆。因此本论文研究整数MDCT(IntMDCT)以实现真正可逆变换并将之用于无损音频压缩。论文证明了MDCT分解为Givens旋转和DCT的推导过程,在此基础上使用两种提升方案――“经典提升”和“多维提升”实现IntMDCT。同时论文对IntMDCT中复杂的矩阵运算提出了相应简化算法,降低了算法实现的复杂度。 为了便于编码,本文对变换后的系数进行了映射处理,并在大量统计分析的基础上,发现经过映射后的IntMDCT系数的概率分布接近于几何分布,因此算法中采用了Golomb-Rice熵编码技术,并且达到较好的编码性能。由于不同频段内变换系数的幅度差异,本论文对于不同频段的变换系数采用了不同的Golomb-Rice编码参数以得到最优的压缩效率。 论文同时设计了适合于该无损音频压缩算法的比特流结构,并实现了该无损音频编解码算法,分析了采用两种提升实现IntMDCT相对于浮点变换结果的逼近误差,以及对于整个算法压缩性能的影响。论文最后对算法的压缩效率、鲁棒性和复杂度等性能进行分析。对SQAM中70个测试曲目编码的实验结果表明,本算法的平均压缩比为3.17,具有较高的压缩效率;并且本算法具有较好的鲁棒性和较低的复杂度。
其他文献
以太网是一种在局域网中获得重大成功的技术,取代了其他一度很有前途的技术,如令牌环、FDDI、ATM。以太网的简易性及其价格/性能优势使其成为最终的赢家,其应用领域从企业工作组
随着计算机硬件技术和宽带网络的快速发展,人们希望互联网不再只有简单的网页浏览、文件下载等功能,更能承载实时的视、音频信息。因此,能满足“边下载边播放”的流媒体技术应运
自动交换光网络ASON(Automatic Switched Optical Network)是一种用户发出请求,由信令网控制并实现光传送网内链路的连接/拆线、交换、传送等一系列功能的新一代光网络,它是在
职业教育是现代教育的重要组成部分,它直接为经济社会各部门培养、输送职业技术人才。它以培养技能型、应用型人才为目标,突出的是理论知识与实践知识的紧密结合,培养的人才既要
多载波码分多址(MC-CDMA)技术具有频率分集、对抗频率选择性衰落能力强、容易实现同步等优点。在下一代移动通信系统的研究和开发中,MC-CDMA技术将是一种主要的物理层数据传输和
码率控制算法大多是开放的,不同的应用场合对应不同的码率控制算法,视频编码标准只规定了视频压缩码流的语法结构。码率控制算法的性能直接影响视频编码的质量,因此研究性能优异
延迟容忍网络(Delay Tolerant Network, DTN)作为一类分布式自组织网络,节点间的通信通过无线信道,并由多个节点转发来共同完成,因此节点的合作与否是通信实现的关键。但是节点
无线传感器网络综合了传感器技术、嵌入式计算技术、分布式信息处理技术和无线通信技术,能够协作地实时监测、感知和采集各种环境或监测对象的信息,经处理后,将结果传送给用户。