基于波束形成和时频掩蔽的多通道语音增强技术研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:y412327391
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音增强是前端声学信号处理的一个重要内容,其是语音质量提升的一种重要手段也是后续语音任务的前提与基础。然而,实际生活场景中存在各种各样复杂多变的干扰严重影响传播的语音的质量,因此如何提升带噪语音的质量是一项具有很大挑战性的工作。相比于传统的单通道语音增强技术,多通道语音增强技术能够额外的利用语音的空域信息,在一定程度上有利于提升复杂环境下的带噪语音的质量。本文对基于波束形成和时频掩蔽的多通道语音增强技术进行了相应的研究,研究的内容主要有以下几个方面:(1)研究了传统的麦克风阵列信号处理技术,在此基础上分析了经典的用于多通道语音增强的波束形成算法以及常用的后置滤波算法的优缺点。最后分析了现有的语音质量评价中的主观评价与客观评价,并且选取客观评价指标中的PESQ和STOI两个指标为后续实验效果分析的客观指标。(2)研究了时频掩蔽技术和循环神经单元及其主要变体,提出了结合时频掩蔽和循环神经网络的多通道语音增强算法。时频掩蔽技术为我们的监督学习提供了良好的监督目标而循环神经单元相比于传统的神经元能够更好的利用历史信息,更重要的是使用循环神经网络来搭建后置滤波算法能够进一步的提升延时求和波束形成后的语音的质量,所提的算法在合成的数据集上与实录的数据集上均验证了其有效性与优越性。(3)研究了卷积神经网络的基本组成结构和多目标学习理论基础,提出了结合卷积神经网络和多目标学习的多通道语音增强算法。卷积神经网络具有很强的自动学习所需特征的能力,而多目标学习有利于进一步提升模型的泛化能力,更重要的是使用卷积神经网络可以将固定波束形成与后置滤波算法融合成一个整体。实验结果证明所提的结合卷积神经网络和多目标学习的多通道语音增强算法不仅在仿真的数据集上有效,在实际场景中录制的多通道语音下同样具有效果。
其他文献
下一代无线通信涉及三种密度要求,即高用户密度、高流量密度以及密集的接入点部署,VLC作为一种新兴技术,有望解决传统无线频段的频谱资源紧张问题;PDNOMA技术作为一种新型多址接入技术,可以在吞吐量和公平性之间取得平衡。本文主要研究了PD-NOMA技术在室内可见光通信中的应用,具体围绕三个问题展开研究:一、研究了PD-NOMA-VLC系统下行链路的用户分组问题。首先基于DCOOFDM-VLC系统给出
低密度奇偶校验(Low-Density Parity-Check,LDPC)码是被证明能逼近香农极限的一种优秀的信道编码方案。由于LDPC码具有强大的译码性能,近年来被大量研究。1963年,Gallager在他的博士论文中提出LDPC码的同时也给出了比特翻转(Bit Flipping,BF)译码算法以及和积算法(Sum-Product Algorithm,SPA)这两种基本的LDPC码的译码算法。
随着移动应用的迅猛增长,用户设备(user equipment,UE)本地有限的计算资源和电池电量成为制约用户体验的瓶颈,将任务卸载到传统的云计算平台的方式会造成任务时延过长,因而无法在实时应用场景中改善用户体验。移动边缘计算(Mobile Edge Computing,MEC)将传统核心网中的云计算资源下沉到无线接入网,可以为用户提供计算和存储资源。利用移动边缘计算,可以为用户提供近距离、低时延
随着第五代(5G,5th Generation)移动通信系统的商用,5G开始为社会提供更高效的服务,跟随5G所研发的服务逐渐增多。近年来,人工智能技术的快速发展逐渐显示出了强大的能力,传统行业也在应用各种人工智能技术来提升效率。在通信算法中,有着许多高性能的算法,如大规模MIMO中基于预编码的相关优化算法,但其复杂度高,难以在实际系统中部署。因此,如何降低现有算法的复杂度也逐渐受到关注。人工智能技
随着移动通信和无线物联网技术及应用的迅猛发展,商业、医疗以及公共安全等领域都对面向终端与节点设备的LBS产生了广泛的需求。由于具有在复杂NLOS场景下实现较为准确定位的突出性能特点,无线终端的指纹定位技术已成为移动通信技术学术界近年来的研究热点。根据基于多站LTE终端指纹定位技术与系统研发目标及任务的规划安排,论文主要就LTE上行接收系统的设计与实现开展了具体研发工作,为研发目标系统获取高质量的终
毫米波和Massive MIMO是下一代移动通信中的关键技术。波长较短的毫米波有利于大规模天线面板的集成,而Massive MIMO可以通过波束赋形提供高方向性波束以补偿毫米波信号的传输损耗,二者融合而成的毫米波Massive MIMO能有效提高系统容量和能量效率。因此,毫米波Massive MIMO成为国内外通信领域研究的热点。当基站端与用户端同时采用波束赋形时,高效的波束管理可以显著提高毫米波
多射频多信道无线Mesh网络相比于单射频单信道无线Mesh网络,可以获得网络吞吐量的增加,网络健壮性的增强、网络可扩展性的提升以及网络容量的增加,从而获得更好的网络整体性能。本文围绕多射频多信道无线Mesh网络信道分配与路由联合优化算法展开研究,目的是提高吞吐量、降低时延,提升网络整体性能。本文的主要工作如下:首先,研究了多射频多信道无线Mesh网络信道分配策略以及路由技术。分析了典型的静态分配策
无线自组织网络传输不依赖于有线基础设施,且具有部署快速、扩展灵活、顽存性强等优点,被广泛应用于应急保障、突击部署以及抢险救灾等军民通信领域,已经成为现代无线通信技术的一个重要研究方向。设计和实现适合多种应用场景下的高性能无线移动自组织网络(High-performance Mobile Ad-hoc Network,HpMANET)是目前该领域技术研究与开发的一个重要方向。论文重点就HpMANET
随着5G的正式商用,作为5G关键技术之一的大规模MIMO技术受到了越来越多的关注。大规模MIMO技术在基站侧配置成百上千个天线单元,充分利用多天线带来的空间自由度,显著地提升了系统的传输速率和频谱效率。为了更好地评估和研究大规模MIMO系统的性能,针对大规模MIMO信道的研究必不可少。本文针对大规模MIMO信道特性,分析了大规模MIMO信道模型的近场效应和非平稳特性并研究了基于联合相关的大规模MI
第五代移动通信系统(5G,5th Generation Mobile Communication Systems)新空口(NR,New Radio)标准规范定义了灵活的参数集和帧结构,引入了大规模天线、波束赋形、新型信道编码方案等技术,旨在大幅提升以人为中心的移动互联网的同时,全面支持以物为中心的物联网业务,实现人与人、人与物和物与物的智能互联。大规模多输入多输出(MIMO,Multiple In