【摘 要】
:
随着人们对移动电话和IP电话持续增长的需求,对语音编解码器的性能要求也日益提高。然而,在通信过程中会受到各种噪声的干扰,大大地影响了通信质量和可懂度。其中,语音增强作为语音编解码器的核心技术,决定了编解码器性能的好坏。因此,本论文试图研究一套在低信噪比以及非平稳噪声环境下均适合的语音增强方案并将其应用在增强型语音服务(Enhanced Voice Services,EVS)编解码器中。本论文的研究
论文部分内容阅读
随着人们对移动电话和IP电话持续增长的需求,对语音编解码器的性能要求也日益提高。然而,在通信过程中会受到各种噪声的干扰,大大地影响了通信质量和可懂度。其中,语音增强作为语音编解码器的核心技术,决定了编解码器性能的好坏。因此,本论文试图研究一套在低信噪比以及非平稳噪声环境下均适合的语音增强方案并将其应用在增强型语音服务(Enhanced Voice Services,EVS)编解码器中。本论文的研究工作主要围绕非负矩阵分解与时频掩蔽估计两种方法进行介绍,分别包括以下三方面内容:首先,针对非负矩阵分解方法不能准确估计语音基矩阵和噪声基矩阵而导致过多的残留噪声,且时频掩蔽估计方法中高频区语音能量较低且等效带宽较宽,分辨率低而导致高频部分语音失真严重的问题,提出了一种融合非负矩阵分解与听觉域下时频掩蔽估计的语音增强方法。该方法首先在线下分别训练语音和噪声的基矩阵,结合从含噪语音在线估计出的编码矩阵来构建维纳滤波器,并转换成Gammatone域(也称为听觉域)下理想比值掩蔽估计的形式,然后在线上增强阶段结合自身的时频掩蔽估计,形成一种新的语音增强算法。经实验测试表明,所提算法的性能均优于参考方法。其次,由于上述语音增强方法在线下训练阶段没有考虑到训练目标估计的准确性,易造成增强部分的效果较差。所以,提出了一种改进的时频掩蔽估计的深度神经网络(Deep Neural Networks,DNN)语音增强方法。该方法在线下训练阶段通过构建一种新的深度神经网络目标代价函数来优化训练目标,进而在线上增强阶段得到具有较强增强效果的语音。实验结果表明,所提方法能够提高语音的可懂度。最后,本文将介绍基于EVS编解码器的工程应用方面。将改进的时频掩蔽估计的深度神经网络语音增强技术嵌入到EVS编解码器的前端,实现了EVS编解码器的语音增强功能。经测试表明,相比于原EVS语音编码器,所提语音增强技术充分提高了EVS编解码器的语音质量和可懂度,具有一定的实用价值。
其他文献
目的探讨黄芪多糖(APS)对阿尔茨海默病(AD)大鼠海马超微结构和低密度脂蛋白受体相关蛋白1(LRP1)水平的影响。方法 Wistar大鼠随机分成对照组,模型组,治疗组(吡拉西坦0.5 g/kg),APS高
环境损害司法鉴定意见所特有的客观性、科学性表明其在环境侵权诉讼中证明专业、复杂的案件事实起到举足轻重的作用,但不可否认其局限性,它只是法官审理案件过程中事实认定的
目的:以CT灌注成像(CTP)作为对照,探讨磁共振动脉质子自旋标记(arterial spin labeling,ASL)技术在急性脑梗死及判断缺血半暗带中的应用价值。方法:使用德国SIEMENS Skyra 3.
为解决信源在较低信噪比情况下的测向分辨率问题,提出阵列可扩展的声矢量锥形阵测向算法。算法基于四阶累积量的阵列扩展和高斯噪声抑制特性,计算声矢量传声器不同输出分量的
文章阐述了水稻纹枯病发生的病原物及发病症状,并分析了利于发病的因素,同时提出了清除菌源、合理密植以及药剂防治和生物防治方法。
中古时期人们十分重视“文学”教育,“戒子”、“家戒”一类文章多有文学传统教育之内容。家族对文学“早慧”者多有关注,为之延誉并刻意培养,这种关注有的是舅家来实施的。家族
近年来,迅猛增长的冷链运输需求为铁路冷链物流带来了发展机遇。中铁特货公司是我国专业的铁路冷链物流运输公司,随着铁路体制改革的顺利实施和铁路潜在运能的释放,巨大的市
会展和旅游业相互关联和渗透,在产业融合和联动发展方面具有较高可行性。本文在对会展与旅游业间的产业关联性、融合条件分析的基础上,提出会展和旅游业联动发展路径的相关建
2019年2月,英国政府发布最新的“海事战略2050”,内容涉及技术、人才、环境、贸易、基础设施以及安全六大方面,其中包括189项短期、中期和长期发展提案和建议,对英国海事行业
贵州遵义市沙滩孕育了一大批文人学者,其成就涉及广泛,著述丰厚,表现出在经学、文字学、版本目录学、地理学、天文学、农学、医学以及翻译诸多领域的较高造诣。与沙滩这个美