论文部分内容阅读
现实生活中,语音常常受到环境噪声的影响而使通话质量下降,严重时使语音处理系统不能正常工作。在这种情况下,必须采用信号处理技术对带噪语音信号进行增强,以抑制环境噪声,从而提高语音质量。多年来学者们不懈努力,寻求各种优良的语音增强方法。 本论文在前人工作的基础上,主要从以下三个部分对语音增强方法进行了研究。 研究了基于噪声类型判别的传声器阵列语音活动检测方法。语音活动检测是语音增强技术中常用的一种辅助手段。以往的语音活动检测算法要么预先需要背景噪声和语音的统计信息,难以快速实现;要么只能用在信噪比较高的场合;并且大都是基于单路信号的检测技术,运算量较大。针对这些问题,本文给出一种基于噪声类型判别的传声器阵列语音活动检测方法。实验结果表明,它能够对语音段的端点进行准确的检测,检测结果明显优于传统的能量检测算法,运算量明显降低。 研究了噪声和混响情况下的语音增强方法。本文针对同时存在噪声和混响的情况,研究了基于子带盲源分离和后置处理的语音增强方法。理论分析和计算机仿真实验结果表明,该方法对混响、不相关噪声和弱相关噪声的抑制效果不明显,并且对语音信号有一定程度损伤。为了将该方法应用于实际环境,对基于子带盲源分离和后置处理的语音增强方法进行了改进,仅在分离效果不佳的子带内进行自适应噪声抵消,从而进一步提高了语音信号的质量。 研究了多说话人情况下的语音增强方法。在多说话人情况下,为了提高分离出的目标语音信号的清晰度,要求语音失真小,同时减少“音乐噪声”对主观听觉的不良影响。本文将时频掩蔽效应引入盲源分离语音增强系统中,给出一种基于时频掩蔽效应和盲源分离的语音增强方法,并将其与期望最大化方法进行了性能比较。实验结果表明,利用时频掩蔽效应可以提高语音的清晰度和舒适度。