基于延迟—求和的麦克风阵列语音增强算法研究

被引量 : 0次 | 上传用户:jiahongtao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在信息高速公路、多媒体技术、办公自动化、现代通信及智能系统等领域中,语音信号通常不可避免地会受到噪声、混响乃至其他语音的干扰。这些干扰不仅会使接收者得到的语音被噪声污染,同时也会导致语音处理系统的性能急剧恶化。语音增强作为前置处理方案是抑制干扰的有效途径。因此,研究采用何种语音增强算法从带噪语音中提取尽可能纯净的语音,具有重要的意义。本文详细阐述并比较了几种经典的单通道和多通道语音增强算法。重点研究了麦克风阵列语音增强的算法,实现了一种改进算法。延迟-求和波束形成算法在消除相干噪声方面具有较好的效果,对于非相干噪声及音乐噪声则能力有限。因此改进算法主要包含三个模块:延迟-求和波束形成、基于有/无语音检测的短时对数谱最小均方误差估计(LSA-MMSE)、后置滤波。鉴于延迟-求和方法的不足,为了更好的消除背景噪声,将信号通过改进的LSA-MMSE算法,能取得更好的消噪性能,但是还是有小部分的非相干噪声存在。针对这个缺点,本文又添加了一个后置维纳滤波,经matlab编程仿真该算法,证明了该算法的确具有很好的稳定性及消噪性能。仿真测试结果表明,相对于传统的延迟-求和波束形成的麦克风阵列语音增强系统,采用改进的算法对语音的处理具有更好的强健性,并且具有更高的输出信噪比。
其他文献
本文以"互联网+"运输服务为研究对象,在阐述"互联网+"的定义、移动互联网对运输服务领域产生的影响以及"互联网+"运输服务的概念和特征的基础上,深入分析移动互联网对运输服
随着社会主义市场经济的迅猛发展,高等教育体制改革的不断深化以及高校作为独立法人实体地位的确立,高等学校逐步走向市场。随着高校扩大办学规模、提高办学层次,原有的预算
在产品同质化和市场竞争激烈的时代背景下,各大商业银行亟待开拓金融服务“蓝海”——实现服务与产品相互渗透、相互融合已成为发展趋势。金融业客户服务的重要性已经获得普
目的探讨小野寺预后营养指数(Onodera′s PNI)诊断狼疮肾炎(LN)的临床价值。方法选取2016年1月至2019年5月在无锡市中医医院风湿科就诊的92例成年系统性红斑狼疮(SLE)患者作
<正>厌食症是指小儿较长时间见食不贪,食欲不振,饮食少思或不思饮食的一种疾病。严重者可发展为拒食。长期厌食、拒食会导致儿童营养不良,最终会影响小儿的生长发育,包括各器
<正> 清代医家叶香岩在《外感温热篇》中提出“通阳不在温,而在利小便”的论点,对后世有重大影响,有效地指导着临床实践。本文拟就其基本内容和应用原则作简要阐述。
可转换债券(convertible bond,简称可转债或转债),是一种兼具债性和股性的可转换融资工具。国外关于可转债的研究开始得较早,相对比较成熟,已经形成了丰富的理论文献和实证结
本文首先在ANSYS中利用APDL语言,通过参数文件中给定轮系的齿数、模数、行星轮个数、压力角、齿宽、齿轮的变位系数等参数,自动生成行星轮系的有限元模型,包括太阳轮、行星轮
语音是人类日常生活中最有效、最方便,同时也是最常用的交流手段。但是,在实际的生活中,很多的时候语音常常受到来自周围环境、传输媒质引入的噪声、内部噪声、以及其他讲话
房地产市场是一国经济的风向标,在全球金融危机的大背景下,我国楼市却异常火暴,这是什么原因呢?该文从税收政策的微观经济学的角度入手,先简要介绍当前税收政策控制房地产市