论文部分内容阅读
传统的基于奈奎斯特采样定理的信号处理框架,面对超宽带信号及冗余度较高的信号,处理起来不仅浪费采样资源而且效率低。近年来出现的压缩感知理论,利用了信号的稀疏特性,可以实现对信号采样的同时进行压缩,把复杂度从采样端转移到了重构端,大大降低了信号的采样成本,减少了数据量,成为信号处理领域的研究热点。然而,对于数字系统而言,采样只是信号数字化的第一步,真正数字化还有一个重要的环节——采样数据的量化编码,对于刚刚起步的压缩采样理论的研究,目前还很少涉及对压缩采样后观测序列的处理,本文正是在这样背景下,以压缩感知理论为基础,研究压缩采样环境下的语音数字编码技术。这是压缩感知理论真正走向实际应用的前提。首先,本文结合语音信号稀疏预处理技术,提出了基于稀疏预处理的语音压缩感知矢量量化编码方案。对输入的语音先做稀疏预处理工作,然后采用随机高斯观测矩阵进行投影,对压缩采样得到的观测序列进行矢量量化编码,在解码端,对接收到的信息进行矢量解码得到观测序列,再进一步利用压缩重构技术重构出原始语音信号。通过仿真实验表明:稀疏预处理有效地提高了语音信号的稀疏表示效果,与未经稀疏预处理的语音压缩感知矢量量化编码相比,在数码率相同的情况下,合成语音的质量有所提高。接着,本文提出了一种基于量化压缩感知的语音压缩编码方案,对观测序列采用Lloyd-Max量化,在接收端,不需要矢量量化解码,直接从量化后的观测序列中重构出原始语音。通过仿真实验表明:该编码方法在对观测序列不解码的情况下,能够直接重构出原始语音信号,在实现对语音信号观测序列量化编码的同时,保证了重构语音的质量。为了进一步减少传输的数据量,本文对观测序列进行建模,然后对模型参数进行压缩编码,提出了一种基于观测序列正弦字典模型的语音压缩感知编码方案。首先采用行阶梯观测矩阵对语音信号进行压缩采样投影得到每一帧语音信号的观测序列,然后对其进行匹配追踪正弦建模,分别对模型参数进行压缩编码。通过仿真实验表明:该编码方案在保证重构语音质量的前提下,能够对观测序列进行有效地建模压缩,大大地降低了传输速率。