论文部分内容阅读
近年来,信息技术的高速发展,传统的奈奎斯特采样理论中的极限采样率制约了人们与日俱增的庞大信息量获取的需求,因而压缩感知理论一出现即以其远低于奈奎斯特采样速率的特点备受关注,成为国内外的研究热点。本文将压缩感知技术与语音信号处理相结合,研究基于压缩感知理论的语音特性分析技术,即在非重构原始语音信号的情况下,分析和研究语音压缩采样后观测序列的新特性,从而提出直接从观测序列提取语音特征参数的新方法,例如判别清浊音和基音周期,并利用观测采样序列能量特性进行语音端点检测等,这些都是未来基于压缩感知理论的语音信号处理技术走向实际应用必不可少的前提。首先,本文根据压缩感知理论,研究和分析语音信号压缩感知观测序列的特性;论文分析了传统奈奎斯特采样中能量和过零率两种清浊音判别法在语音压缩感知环境中的适用性。然后根据语音产生的数字模型来分析清音和浊音的特性,从而得出结论:语音清音的观测序列具有近似高斯信号的特性,而浊音的观测序列具有非高斯信号的特性,基于这种特性来设计一种直接针对压缩感知观测序列的三阶累积量来判别清音和浊音的新方法,并给出了在含噪和无噪情况下,该方法与基于压缩采样序列能量判别法、经典的奈奎斯特采样中的能量判别法在准确性和计算量两个方面的比较结果。实验表明,本文提出的方法抗噪性能更好。其次,论文分析语音压缩感知观测序列的波形特点,从数学的角度证明浊音经行阶梯矩阵投影后呈现新的周期性的特点,并给出了观测序列波形的周期与原语音信号周期的关系。然后提出由观测序列的自相关函数和平均幅度差函数求出原始浊音周期的方法,而清音的观测序列并无周期性,由此也可以判别清音和浊音,同时计算量大大减少。第三,论文证明观测序列的能量可近似为原语音信号的能量估计,在此基础上将估计得到的语音能量做为语音端点检测的依据。然后在不同的信噪比下进行语音端点检测,与基于压缩感知观测序列倒谱距离、传统的奈奎斯特采样中能量的语音端点检测方法相比,这种方法减少了计算量。同时,论文提出一种能量和高阶累积量相结合的端点检测方法,在信噪比较低的情况下获得较好的检测效果。本文最后一个研究内容是语音信号的功率谱估计,由压缩采样序列与原语音序列的关系式,推导出压缩采样序列功率谱密度与原语音序列功率谱密度的关系式,并应用压缩感知理论重构来得到原语音信号的功率谱估计。通过Matlab仿真实验给出了这种基于压缩采样序列非完全重构的功率谱估计与重构信号的功率谱估计在计算量和准确度方面的比较,并根据估计结果对语音的频率成分进行分析。在此基础上,本文用“谱减法”对含噪语音作消噪处理,信噪比和MOS均有较大的改善。