基于短时谱估计的语音增强算法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:chentao805
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
噪声环境下,许多语音处理系统的性能急剧下降。语音增强作为解决噪声污染的一种有效的预处理技术,一直是语音信号处理领域中的热门课题。语音增强的目的就是从带噪语音信号中提取尽可能纯净的原始语音信号,提高信噪比,改善语音质量。 基于短时谱估计的语音增强由于具有适用信噪比范围大、方法简单、易于实时处理等优点,是目前应用最广泛的方法。这种语音增强方法通常都采用精确的噪声估计来采集噪声的特性,然后通过良好的增强算法来得到期望的估计语音。本文立足于跟踪国内外的最新技术,系统深入地研究了短时谱增强方法中的各个技术环节,主要实现工作如下: 1.深入地研究了三种基本的短时谱估计方法:谱减法、维纳滤波和最小均方误差(MMSE)估计。在分析了基于语音短时谱估计增强方法的基础上,将先验信噪比的直接判决法估计引入到增益函数的计算中,有效地解决了此类方法增强语音中经常伴随的“音乐噪声”问题。 2.从语音活动检测(VAD)和连续更新噪声谱两方面入手,深入探讨了语音增强系统中的噪声估计问题。在此基础上给出了两种有效的噪声估计方法:基于统计模型VAD的方法与基于最小值约束的快速自适应方法。实验表明,VAD方法计算量小,易于实现,但是对非平稳噪声跟踪力度不够;基于最小值约束的方法能够及时地跟踪噪声变化,获得准确的噪声估计,有效地改善增强效果。 3.针对传统短时谱方法中存在的语音失真问题,研究了人耳的听觉感知特性在语音增强中的应用,提出一种基于听觉掩蔽效应的STSA语音增强算法。该算法根据掩蔽阈值与噪声之间的相对关系,对带噪语音谱分量有选择地进行处理,在抑制背景噪声的同时,有效地减少了对原语音信号的损伤。实验表明,听觉掩蔽的利用能够很好地提高语音质量,改善增强效果。
其他文献
电视技术在经历了黑白电视和彩色电视时代以后,为了改善声音和图像的质量,以及提高频带资源的利用率,必然会向着数字化和高清晰度的方向迈进,数字电视将逐步取代模拟电视。根
森林土壤线虫在维持森林生态系统功能中起着重要作用,国内外学者已开展了许多关于森林生态系统土壤线虫群落结构及多样性的研究,但是以往研究大多局限在较小的空间尺度,在大尺度
随着互连网的各类应用不断丰富,服务器端的工作量也在不断的增大,尤其是web服务器。对于一些商业服务来说,服务中断或者是关键数据的丢失会造成很大的损失。由于以前的服务器
组蛋白甲基化修饰作为表观遗传调控的重要机制之一,在植物生长发育及非生物逆境胁迫响应的转录调节等方面都发挥着极为重要的作用。组蛋白甲基化修饰由组蛋白甲基转移酶和去甲
植物热激蛋白90基因在高温胁迫的环境下能诱导转录,且能在短时间内获得大量的表达热激蛋白90(Heat Shock Protein90,HSP90),而HSP90能促进蛋白质的正确折叠和组装,并可以帮助错误
电力线通信(PLC,Power Line Communication)是利用电力线作为通信媒介来传输数据信息和语音信号的一种通信方式。由于电力线具有组网容易和成本低廉等优点,因而具有很高的应用
毛泽东作为一位开天辟地的政治家、纵横捭阖的军事家、远见卓识的思想家,其滔滔不绝的智慧与谋略,历来是人们所仰慕、所探寻的。正值纪念毛泽东诞辰120周年之际,本刊推介相关
光纤陀螺是光纤传感器技术的一种经典应用,作为一种重要的惯性敏感器,用于测量运载体的姿态角和角速度,构成惯性系统的基础核心器件。由于光纤陀螺具有传统机械陀螺不可比拟
青藏高原作为世界第三极,其高寒草地生态系统的脆弱性及对气候变化影响的敏感性使得该地区成为全球变化研究的典型区域之一。有许多研究表明温度和水分变化对青藏高原高寒草地
相干激光测风雷达,采用收发合置光学天线,脉冲外差探测体制,能够探测到大气中气溶胶的后向散射信号,并从中提取多普勒频率信息,经过数据反演,获取大气二维或三维风场信息,是