基于无线声传感器网络的语音增强研究

来源 :复旦大学 | 被引量 : 0次 | 上传用户:lqh2012
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
无线声传感器网络(Wireless acoustic sensor networks, WASN)作为新一代的音频采集与处理技术,相比单麦克风或麦克风阵列有着更大的空间覆盖范围,对覆盖范围内的声源处理有更大的灵活性。在无线声传感器网络的众多应用中,获取纯净的、清晰的目标语音是主要目的之一,因而语音增强技术研究有着重要意义。由于无线声传感器网络结构的特殊性,其语音增强方法与传统的单麦克风或麦克风阵列有着一定的差异。本文将无线声传感器网络中的语音增强研究分为三个类别,每一类对应一种应用场景:单目标声源语音增强,单声源有效的多目标声源语音增强和多目标声源同时有效的语音增强。单目标声源语音增强对应的是传感器网络中只有一个目标声源的场景。该类语音增强的重点在于麦克风节点选择,即从众多节点中选择有效的节点数据用于语音增强。针对该问题,本文提出了一种节点效用盲评估方法,该方法基于麦克风节点接收信号的高阶统计信息(峭度)与其信噪比间存在的单调递增关系,以单个麦克风接收数据各频点峭度值的加权和作为节点效用值。仿真测试结果表明,该方法简单有效,能得到与理论信噪比极为相似的结果。单声源有效的多目标声源语音增强对应的是传感器网络中存在多个目标声源,但同一时刻只有一个目标声源处于活动状态的场景。该类语音增强的主要任务是确定每一时刻活动的目标声源。本文引入隐马尔可夫模型来描述活动声源间的切换,将麦克风节点接收信号的短时能量作为观测数据,以最大似然准则估计模型参数,并得到各个目标声源的活动性概率,再比较每一时刻该概率的大小,从而判定该时刻活动的目标声源。仿真测试结果表明,该方法能有效地确定每一时刻的活动声源,性能远好于基于阈值判定的方法。多目标声源同时有效的语音增强对应的是传感器网络中存在多个同时活动的目标声源。该类语音增强的难点是分离各个声源的语音。本文以独立向量分析方法(Independent vector analysis, IVA)为基础,提出了一种分布式语音信号盲分离算法,并将该算法在OMAP3530平台上予以实现。该算法将传感器网络中的节点按区域分为多个集合,每个集合执行频域盲信号分离算法,在将各个集合得到的分离语音进行融合,最后输出所有目标声源的语音。仿真测试和实际实验结果表明,该算法能有效地处理多目标声源同时活动的情况,得到较高质量的目标语音。
其他文献
人口分布格局是特定时间内人口在某一地理空间的集散状态,它的形成是区域内自然因素、社会经济因素、政治历史因素等共同作用的结果。其中,自然环境因素作为人类生存发展的基础
旱作农田是N2O的主要排放源,削减其N2O排放有助于整体降低农田温室气体排放。本研究通过对已发表文献数据的收集和整理,共得到关于全球小麦和玉米农田N2O减排文献157篇,N2O排放
该文提出了一种有效的工作于RT级的VHDL描述的测试生成方法和一个相对应的故障模型,这种测试方法是基于模拟的,用一个VHDL的模拟器和一个遗传算法相结合的方法来生成测试码序
近年来,随着许多新理论、新方法的不断涌现,出现了一大批新的图像压缩编码方法.其中基于小波分析的压缩算法在静态和动态图像压缩领域得到广泛的应用,并且已经成为某些图像压
草地灌丛化是近一个世纪以来干旱半干旱区的主要表现形式,可能会导致生态系统结构和功能的改变,甚至可能导致干旱区土地退化和荒漠化。然而以灌丛化草地为背景的弃耕农田植被、
近十年来,随着无线传感器网络的迅速发展和CMOS工艺技术的不断进步,采用低成本的CMOS工艺实现高性能射频通信电路和系统成为可能。作为无线传输设备的核心器件,射频集成电路
该文从理论和实验两个方面对亚波长结构进行了较为详细和系统的论述,运用等效介质理论对其进行重点分析,设计制作了抗反射光栅样品,并用耦合波理论对设计结果进行了检验.内容
本论文研究内容主要包括两部分:   1、多形汉逊酵母N-糖基化代谢途径的改造   汉逊酵母作为重要的外源基因表达系统被广泛用来生产重组药物蛋白。然而,由于酵母本身存
学位
次生林占东北森林面积的60%以上,然而次生林主要树种不能很好地完成天然更新,很多树种出现了“只见幼苗,不见幼树”的状况,因此,幼苗对环境的适应能力成为决定天然更新成败的
学位
无线光通信系统具有抗电磁干扰、组网机动灵活、无需频谱许可、保密性好、信息容量大和协议透明等诸多优点,是目前研究的热点之一,而传输过程中的湍流极大地影响到系统的性能