论文部分内容阅读
语音增强技术在实际应用中有重要价值。目前,语音增强已在语音处理系统、通信和多媒体技术等领域得到了越来越广泛的应用。本文以语音增强为研究课题,提出基于人耳听觉特性和语音语谱特性的语音增强方法。主要以谱减法为基础,结合人耳的听觉特性从而减少残留“音乐噪声”的影响;结合语音的语谱在时-频域分布特性从而提高增强后语音的听觉质量。根据人的发音特点,通过分析语音的语谱在时-频域的分布,发现把听觉掩蔽效应应用于语音增强时存在不足之处。人耳对2kHz~4kHz频段的语音非常敏感,但是此频段语音的功率谱本身比较小,因而设计出的减参数将比较大。这样得到的减参数在很大程度上破坏了2kHz~4kHz频段语音信息。本文依据语音语谱的时-频域分布特性,提出利用后验Bark信噪比来估计出敏感频段的语音含量,重新设计2kHz~4kHz频段减参数,尽量保护敏感频段的语音信息。实验结果表明,在输入信噪比较高的情况下,本文的方法相对基于听觉掩蔽效应的谱减法,可以在其基础之上有效地提高各种输出信噪比。同时,在语音的主观质量评价中,本文的方法改善了语音的质量。因此,本文提出的语音增强方法在抑制“音乐噪声”的同时,增强了听觉效果。