【摘 要】
:
语音增强的目的是从被噪声污染的含噪语音中尽可能地提取出内容清晰、语义完整的原始纯净语音。语音增强算法作为人机交互、语音通讯等系统中的关键预处理模块,对系统性能的好坏起着至关重要的作用。随着语音技术越来越广泛的应用,对语音增强算法也就有了更高的要求。但是,由于噪声环境的多样性,传统基于全卷积神经网络的时域语音增强算法使用没有明显可辨性的时域特征作为训练目标,很难将噪声与纯净语音区分,造成语音增强算法
论文部分内容阅读
语音增强的目的是从被噪声污染的含噪语音中尽可能地提取出内容清晰、语义完整的原始纯净语音。语音增强算法作为人机交互、语音通讯等系统中的关键预处理模块,对系统性能的好坏起着至关重要的作用。随着语音技术越来越广泛的应用,对语音增强算法也就有了更高的要求。但是,由于噪声环境的多样性,传统基于全卷积神经网络的时域语音增强算法使用没有明显可辨性的时域特征作为训练目标,很难将噪声与纯净语音区分,造成语音增强算法在不同的噪声环境下没有良好的泛化能力。为了解决这一问题,本文对传统基于全卷积神经网络的时域语音增强算法进行研究和改进。本文主要研究内容如下:(1)通过查阅文献、整理资料,以及对语音增强领域的经典论文和前沿论文的阅读,总结了语音增强相关的信号处理知识。了解语音增强技术的发展历史和未来主流的发展方向。探究了全卷积神经网络的核心思想和结构,对主流的全卷积神经网络语音增强算法进行了深入的研究,并分析其优势和缺点。(2)针对传统基于全卷积神经网络的语音增强算法使用没有明显可辨性的时域损失,导致增强语音出现失真或存在残留噪声,且损失函数的设计没有考虑语音的谐波结构,会出现低信噪比环境下语音增强失效的问题。本文提出了一种基于频域谐波损失的时域语音增强算法,该方法使用谐波噪声模型(HNM)对纯净语音进行建模,将建模后得到的频域中的HNM分量作为损失函数中的训练目标。通过最小化频域谐波损失函数训练时域语音增强全卷积神经网络(FCN)。实验结果表明,提出的改进算法,在低信噪比条件下可以有效去除谐波之间的噪声,使语音质量和可懂度显著提高。(3)为了使时域语音增强算法在各种噪声条件下都有良好的去噪效果。针对本文提出的基于谐波损失函数的时域语音增强算法(FCN-HR),存在使用固定语音残余比例系数训练出的增强模型对不同噪声环境自适应能力不强的问题。首先对FCN-HR算法进行了参数寻优,找到不同信噪比下的最优参数模型。然后将最优参数模型与信噪比感知分类器相结合,提出了一种基于信噪比感知的时域语音增强算法。实验结果表明,提出的算法对不同的噪声环境有良好的适应性,在各种信噪比条件下均能取得令人满意的去噪效果。
其他文献
本文主要对两类浅水波方程的解进行定性研究.第一章,主要介绍Holm-Staley b族方程以及一类5阶Camassa-Holm模型(我们将其简称为FOCH模型)相关问题的研究背景和研究现状,并给出
随着社会经济和科学技术的不断发展,能源和环境问题成为人类社会发展过程中必须面对的问题。超级电容器作为一种新型环保储能设备,其能量密度大于传统电容器,而功率密度大于电池,在能源领域具有巨大的市场潜力。对于超级电容器而言,电极材料是决定其性能优劣的关键,因此,找到高性能的电极材料成为了现在研究的热点。在各种电极材料中,聚吡咯(PPy)以其合成简易,性能良好,价格低廉,对环境友好受到了广泛的关注。而聚吡
猕猴大脑与人脑结构较为相似,某些高级功能例如视觉系统也与人相似,因此人们可以通过研究猕猴大脑来了解人脑的某些作用机制。此外,通过比较猕猴大脑和人脑结构的不同来进行跨物种比较也可以揭示更多进化方面的奥秘。对猕猴大脑进行研究的手段主要为对采集的MRI图像进行分析。其中皮下核团的分割最为困难,也最为重要。目前皮下核团的分割主要借助人脑MRI分析软件进行分割,然后再人工修改完善,关于猕猴的自动分割方法较少
近年来,受气候变暖、大气污染以及能源短缺等世界性问题的影响,各国纷纷出台政策支持新能源汽车产业发展,寻求代替传统内燃机车的有效途径。其中,纯电动汽车因其零排放、高效
随着我国社会的不断进步,国内经济也得到了高速发展,我国城市建筑规模不断扩大,而建筑也越来越高,建筑火灾也是屡有发生,因此,火灾自动报警系统被广泛用于建筑物中的预防火灾
乳腺癌是严重威胁女性健康的恶性肿瘤之一,及早地发现与诊断对乳腺癌的防治有着至关重要的作用。随着医学图像处理技术的发展与应用,利用自动分析方法对乳腺肿瘤图像进行定量分析和分割识别已成为现代医疗诊断的一种重要辅助手段。计算机辅助诊断弥补了人工检测中存在的误差大、效率低等缺点,为医学专家提供了更为直观和精确的判断依据,对相关疾病的研究具有重要的应用价值。本文主要从乳腺肿瘤图像的分割与分类两方面展开深入研
药物重定位指的是挖掘已有药物的新治疗作用,已经成为药物设计的重要研究领域。药物重定位的有效途径是预测药物和靶标的相互作用(Drug-Target Interaction,DTI)。仅依靠生物实验进行药物和靶标关系识别,难以在大量药物、靶标中找到有效的药物-靶标对。基于矩阵分解的协同过滤技术在药物-靶标关系预测领域取得了不错的成果。但是仍然存在不足之处:首先,先前矩阵分解方法不能有效利用标签信息和无
库存管理问题是物流管理的核心问题,它与企业成本控制密切相关,直接影响企业经营绩效。以往对单产品补货问题进行了深入研究,随着企业规模不断扩大,订购产品种类和数量也在不
近几年,小微企业在经济发展中的重要性愈发凸显。然而,长期以来,小微企业始终面临着融资难的问题,尤其是如今经济下行压力不断加大,小微企业缺乏有效抵质押物,其贷款高违约率
反恐排爆机器人机械臂自主抓取的研究,结合了图像识别与人机交互技术,主要应用于反恐排爆等特种领域,对提高机器人环境适应性有着重要意义。本论文针对现有机器人物体识别方式存在的不足,主要是通过人眼识别或者远程传输视频数据,以及机械臂远程操作,造成耗时长,操作冗余的缺点,提出以六自由度旋转机械臂为研究对象,选择基于ROS系统进行机械臂自主抓取的研究,并进行人机交互实验研究。首先,确定反恐防爆机器人总体方案