基于语音幅度谱约束的非负矩阵分解语音增强算法研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:bingjilin1986
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于非负矩阵分解(Nonnegative matrix factorization,NMF)的语音增强是目前一种对抑制非平稳噪声非常有效的技术,其使用非负的语音和噪声基矩阵(Basis matrix)来表示语音和噪声的频谱子空间,通过在语音和噪声的联合基矩阵中分解带噪语音的频谱矢量,来获得相应的语音和噪声编码矢量,进而获得估计的语音和噪声频谱分量,实现语音增强。但是此类方法存在两个不足,其一是在语音和噪声基矩阵存在重叠时,该方法会导致语音和噪声源的混淆,其二就是需要和背景噪声匹配的噪声基矩阵,而背景噪声的类型及特性不可能总被提前知道。本文针对这两个不足提出了以下三种改进的方法:首先,本文提出了一种基于码本(Codebook)约束的非负矩阵分解语音增强方法,在训练阶段,该方法训练一个语音码本对语音的幅度谱进行建模。在增强阶段,该方法首先估计噪声的幅度谱,并用其和码本中的语音码字构造基矩阵,然后把带噪语音的幅度谱在构造的基矩阵中进行分解,选出最优的基矩阵和最优的分解,进而得到语音和噪声分量的估计,最后用得到的语音和噪声分量构建一个滤波器实现语音增强。该方法巧妙地用语音码字和噪声幅度谱构建增强阶段的基矩阵,不用预先训练语音和噪声的基矩阵,而且噪声谱是在线估计得到的,因此不存在语音和噪声的源混淆问题和噪声基矩阵不匹配问题。其次,本文提出了一种使用深度神经网络(Deep neural networks,DNN)预测基于非负矩阵分解的维纳滤波器(NMF-based Wiener filter)的语音增强方法,基于非负矩阵分解的维纳滤波器作为一种基于掩膜的训练目标,更有利于参数估计,而且直接预测基于非负矩阵分解的维纳滤波器减少了语音增强过程中的中间误差。此外,该方法利用NMF对带噪语音进行特征提取,并且把获得的特征归一化到零均值和单位方差来获得更有判别力的特征。该方法利用DNN的强大的建模能力学习从带噪语音特征到基于非负矩阵分解的维纳滤波器的非线性映射关系,较好地解决了NMF过程中存在的语音和噪声源的混淆问题。最后,本文提出了一种基于噪声基矩阵在线更新的非负矩阵分解语音增强方法,该方法首先利用一个无语音帧判决模块识别出带噪语音的无语音区域,然后利用一个固定长度的滑动窗口来包含若干帧最近过去的带噪语音的无语音帧,并用这些无语音帧的幅度谱在线更新噪声基矩阵,最后利用更新得到的噪声基矩阵和预先训练的语音基矩阵实现语音增强。该方法能够在线更新出匹配的噪声基矩阵,有效地解决了噪声基矩阵不匹配的问题。
其他文献
学位
广义近似消息传递算法,双线性广义近似消息传递算法以及参数化双线性广义近似消息传递算法在压缩感知领域具有广泛的应用。该文基于深度学习网络化广义近似消息传递算法、双线性广义近似消息传递算法及参数化双线性广义近似消息传递算法,使用数据集以训练的方式更新参数,减少算法所需先验知识,使参数更加贴合目标问题的解决,在具体应用上体现出更为优秀的性能。论文具体内容如下:首先,引入深度学习中深度网络的相关知识,网络
随着网络的盛行与网络技术的发展,用户可在网络中发表自己对事物的观点,这些观点中含有用户想要表达的情感因素。这些含有明显情感的评论可以直接反映用户或网民对该事物的看
随着公众对于养老问题的重视与老年产品市场需求量的日益扩增,家庭型看护机器人可应对人口老龄化所造成的重大社会服务问题,满足快速增长的市场新需求。现阶段服务机器人研究
学位
电动汽车的快速增长对电网的安全稳定运行带来巨大的挑战。但电动汽车与电网互动(Vehicle-to-grid&Grid-to-vehicle,V2G&G2V)技术可以为电网提供分布式储能服务,是未来智能电
土地生态价值是土地自然价值的重要组成,极大程度上影响着人居环境和生态环境的可持续性。结合区域自然环境和社会发展实际需要来推动土地合理利用,以及土地功能开发和保护,
光纤传感器由于其质量轻、体积小、抗电磁干扰、可在高温高压等恶劣环境下使用等特点,已经成为国内外研究发展的热点,被广泛地应用于工业控制过程、各种环境监测等领域。研究双参数光纤传感器不仅可以实现传感器的集成化、降低系统成本,更是解决光纤传感器多参量交叉敏感问题的有效方法之一。本论文设计制作了两种不同类型的双参数光纤传感器,并开展了相关性能的测试工作。本文主要工作内容及创新点总结如下:(1)概述了光纤传
在空间机械臂的控制过程中,由于系统的非线性、时滞性以及模型的不确定性,采用传统的PID控制的方法难以保证控制精度,因此需要一种结构简单,具有较强的非线性控制性能的控制器。因此本文给出一种基于NARX(Nonlinear AutoRegressive network with eXogenous inputs)网络的内模控制器设计方法,完成非线性、未知数学模型对象的控制器设计。具体如下:(1)针对传
学位