听觉掩蔽效应的MMSE语音增强算法

来源 :企业导报·上半月 | 被引量 : 0次 | 上传用户:awangvip
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  [摘要]语音增强不仅与信号处理技术有关,而且涉及到人的听觉感知和语音学。基于听觉掩蔽效应的MMSE语音增强算法,在消除背景噪声、音乐噪声、增加语音可懂度和提高语音自然度等方面比谱减法更加有效。本文首先阐述了MMSE语音增强算法的内涵,并对听觉掩蔽效应与MMSE语音增强算法结合进行分析,具有一定的参考价值。
  [关键词]听觉掩蔽效应;MMSE;语音增强算法
  
  一、前言
  
  在语音信号的理论和应用中,所用的语音数据大部分都是在接近理想的条件下采集的。大多数语音识别和语音编码在开始研究时都要在高保真设备上录制语音,尤其要在无噪环境下录音。然而,在语音通信过程中会不可避免的受到各种噪声的干扰,这种干扰将最终导致接收者接收到的语音信号已非纯净的原始语音,而是受到噪声污染后的带噪语音,因而有必要对语音信号进行增强处理。语音增强的目的主要有两个:一是改进语音质量,消除背景噪声,使听者乐于接受,不感觉疲劳,这是一种主观度量:二是提高语音可懂度,这是一种客观度量。这两个目的往往不能兼得。
  语音增强不仅与信号处理技术有关,而且涉及到人的听觉感知和语音学。另外,噪声来源众多,随应用场合不同,其特性也各不相同。即使在实验室仿真条件下,也很难找出一种通用的语音增强算法适用于各种噪声环境。必须针对不同噪声,采取不同的语音增强对策。目前国外已产生的几种算法也都是针对不同的噪声源处理,减少和消除它们对原始语音的干扰。
  
  二、MMSE语音增强算法的内涵
  
  MMSE语音增强算法即最小均方误差语音增强算法,它是利用已知的噪声功率谱信息,从带噪语音中估计出语音信号。由于人耳对相位不敏感,可以认为相位对语音质量影响不大,MMSE语音增强算法仅对频谱幅度的对数感兴趣,带噪语音的短时谱可用短时傅立叶变换的帧计算得到,提取其相位后存储起来,然后对纯净语音的短时对数谱作最小均方误差。处理后的语音由估计得到的幅度谱和相位重建。MMSE语音增强算法基于听觉掩蔽效应,种频率的声音阻碍听觉系统感受另外一种频率的声音,这种现象叫做听觉掩蔽效应。
  
  三、听觉掩蔽效应与MMSE语音增强算法结合分析
  
  听觉掩蔽效应又分为频域掩蔽和时域掩蔽。掩蔽声与被看掩蔽声同时作用时发生掩蔽效应称之为频域掩蔽效应。频域掩蔽是心理声学模型的基础。频域掩蔽中,掩蔽声有掩蔽效应发生期间一直作用,是一种较强的掩蔽效应。通常频域中的强音会掩蔽与之同时发生的附近的弱音,弱音离强音越近,越容易被掩蔽。相反,离强音较远的弱音不容易被掩蔽。比如,一个1000Hz的音比另一个900Hz的音高18dB,则900Hz的音将被1000Hz的音掩蔽。而1KHz的音要比1800Hz的音高18dB,则这两个音将同时被听到,如果想让1800Hz的音听不到,则1000Hz的音要比1800Hz的音高45dB。所以,一般低频的音容易掩蔽高频的音;在距离强音较远处,绝对听觉门限比该强音所引起的掩蔽阈值高,这时,噪声的掩蔽阈值应该取绝对听觉。
  时间上相邻声音之间的掩蔽现象称谓时域掩蔽。也就是说掩蔽声和被掩蔽声不同时出现,所以又叫做异时掩蔽。它又分为导前掩蔽和滞后掩蔽。掩蔽声音出现之前的一段时间内发生掩蔽效应,则称为导前掩蔽;否则称为滞后掩蔽。产生时域掩蔽的主要原因是人的大脑处理信息需要花费一定的时间,异时掩蔽也随着时间的推移很快会衰减,是一种弱掩蔽效应。一般情况下,导前掩蔽只有3ms~20ms,而滞后掩蔽却可持续50ms~100ms。
  由于环境的复杂性,任何增强算法都有其优点和局限性,MMSE算法和入耳听觉掩蔽效应相结合,根据掩蔽阈值来调整增益值,从而使得增强语音的残留噪声和语音畸变较小,提高了感知质量。
  
  四、结语
  
  经过处理大量电台录制的声音样本,得出基于听觉掩蔽效应的MMSE语音增强算法,在消除背景噪声、音乐噪声、增加语音可懂度和提高语音自然度等方面比谱减法更加有效。
其他文献
无论是在政府还是企业中,行政工作都是必不可少的.良好的、积极的行政文化有助于团队的发展,能够更好的发挥员工的凝聚力和潜力,但传统文化和现代文化的不断碰撞导致行政文化
热闹一时的讨伐“闭口费”事件,渐渐平息了下来。现在回过头看看,是颇值得回味的。“闭口费”事件是由一家矿厂引起的。山西干河矿难发生后,为了掩盖丑事,堵住舆论的口,某些
俗话说,乱世黄金盛世收藏。谈到收藏,首推古董,不过古董距离普通人太过遥远,抛开价格不说,真假都认不清,贸然去碰,除了上当没有第二种结果。在我看来,工薪阶层搞收藏,别管选了哪个门类,如果没有几十年如一日地专心钻研,加上一定的悟性,最终很难有所建树。不过,如果抱着“我收藏我快乐”的心态,收藏还是一件很有意思的事。回顾我这些年的收藏经历,就很好地诠释了这一点。购买镶嵌金饰 遭遇金价暴跌  对收藏感兴趣的
期刊
糖尿病已经成为继肿瘤心血管病变之后第三大严重威胁人类健康的慢性疾病之一。患病率不断增加,越来越多的人也深知糖尿病的厉害。控制血糖是医疗与护理的基本出发点,也是最终目
本文主要从介绍电力企业中思政工作的重要性入手,发现其思政工作中主要存在问题,并就这些问题提出有关解决策略,最后得出结论。 This article mainly introduces the import
[摘要]对不同桩体材料的复合地基及加桩垫和土工格栅的复合地基竖向静载的模型试验,分析了在相同条件下,传统复合地基、桩顶加完全柔性桩垫,桩顶加完全柔性桩垫和土工格栅的三种不同的地基情况中地基沉降及桩土应力比的变化规律。研究发现,在传统复合地基桩顶加入桩垫及桩垫和土工格栅后,复合地基的沉降及沉降差明显增大;复合地基的桩土应力比有日月显的_减小,复合地基桩土受力更均匀。
摘 要:大学生课外科技活动是提高大学生实际动手能力和科技创新能力的有效活动载体。因此,要大力发展和有效推进。但教师在课外时间指导毕竟是有限的,对于大学生的指导存在不够及时、便利性差、学生接受慢等问题,成为制约大学生课外科技活动创新能力的一个首要问题。发挥朋辈辅导的力量,恰恰是解决这一矛盾的有效举措。通过分析朋辈辅导的内涵,朋辈辅导的现实意义,以及大学生课外科技活动在辅导方面所存在的问题,探索大学生
理想的教育是让学生在幸福的环境下学习成长,因此如何建立幸福美好的教学环境,让孩子们在轻松健康的氛围里学习,成为班主任新的思考命题.班主任作为学生的引领者和教育者,对
目的 分析本院临床非发酵菌的感染分布及耐药情况.方法 做细菌培养及鉴定,药敏试验采用K-B法,药敏结果判定根据NCCLS2008年版标准判定.结果 (1)共分离非发酵菌389株,占临床细
安徽合肥市包河区凌大塘社区的盛汝芝唯一的儿子张凯,上大学一年级时因病不幸去世.儿子的7名高中同学张凯、付晓争、李飞等自发承担起赡养她的义务.rn“他们一点不比亲儿子差