基于盲源分离的语音增强方法研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:fairstone
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现实生活中,语音常常受到环境噪声的影响而使通话质量下降,严重时使语音处理系统不能正常工作。在这种情况下,必须采用信号处理技术对带噪语音信号进行增强,以抑制环境噪声,从而提高语音质量。多年来学者们不懈努力,寻求各种优良的语音增强方法。 本论文在前人工作的基础上,主要从以下三个部分对语音增强方法进行了研究。 研究了基于噪声类型判别的传声器阵列语音活动检测方法。语音活动检测是语音增强技术中常用的一种辅助手段。以往的语音活动检测算法要么预先需要背景噪声和语音的统计信息,难以快速实现;要么只能用在信噪比较高的场合;并且大都是基于单路信号的检测技术,运算量较大。针对这些问题,本文给出一种基于噪声类型判别的传声器阵列语音活动检测方法。实验结果表明,它能够对语音段的端点进行准确的检测,检测结果明显优于传统的能量检测算法,运算量明显降低。 研究了噪声和混响情况下的语音增强方法。本文针对同时存在噪声和混响的情况,研究了基于子带盲源分离和后置处理的语音增强方法。理论分析和计算机仿真实验结果表明,该方法对混响、不相关噪声和弱相关噪声的抑制效果不明显,并且对语音信号有一定程度损伤。为了将该方法应用于实际环境,对基于子带盲源分离和后置处理的语音增强方法进行了改进,仅在分离效果不佳的子带内进行自适应噪声抵消,从而进一步提高了语音信号的质量。 研究了多说话人情况下的语音增强方法。在多说话人情况下,为了提高分离出的目标语音信号的清晰度,要求语音失真小,同时减少“音乐噪声”对主观听觉的不良影响。本文将时频掩蔽效应引入盲源分离语音增强系统中,给出一种基于时频掩蔽效应和盲源分离的语音增强方法,并将其与期望最大化方法进行了性能比较。实验结果表明,利用时频掩蔽效应可以提高语音的清晰度和舒适度。
其他文献
在广播电视领域数字化的浪潮中,数字广播电视正在取代着模拟广播电视。然而模拟广播电视数量众多,不可能被即时淘汰,在由模拟广播电视向数字广播电视过渡的这段时期内,作为数字电
目前,IP网络测量是一个热点研究课题,它的目的是用测量手段取得网络的性能和服务质量参数,为服务质量控制、管理和计费等提供支持。 在用IP网络测量来进行网络性能评估的研究
期刊
OFDM(正交频分复用)是一种多载波调制技术。它最大的优点是对抗频率选择性衰落,同时又提高了频谱利用率。它不仅可以增加系统容量,更重要的是它能更好地满足多媒体通信要求,所以
超宽带无线通信技术具有数据传输速率高、成本低、功耗小、抗干扰能力强等优点,被认为是下一代无线个人局域网物理层的标准。负责制定下一代无线个人局域网物理层标准的IEEE80