面向航空管制的轻量化语音增强算法研究与实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:zitayangxin2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音是最常见的一种沟通方式,为了使机器代替人工,开发人员提出了语音识别技术,使得机器能够代替人脑来将语音转化为文本。但是带噪环境下语音识别技术的准确率会显著下降,所以往往需要使用语音增强技术作为其前端先进行处理。本文面向航空管制场景,探索了复杂噪声环境下的轻量级语音增强方案。研究了可以在不同噪声环境下自适应地学习该种噪声特征、并有针对性进行降噪的算法。由于提出的算法均基于卷积神经网络,所以将不同的前沿轻量级卷积层引入模型中,替代原来的普通卷积网络层,来实现模型压缩,便于更好地应用于嵌入式等小型设备中。此外,还将提出的网络模型应用到实际项目中。总的来说,本文贡献如下:(1)研究噪声自适应语音增强算法。为了有效提高模型的泛化性,使得模型能够在有限噪声数据集下训练,在无限种噪声数据集中测试仍能取得良好的降噪效果,考虑将压缩激发模块(Squeeze-and-Excitation)添加到由多个卷积神经网络层构成的编码器-解码器中。这样,模型可以自适应地过滤噪声特征,保留语音特征,从而有效应对不同的噪声,在复杂噪声条件下取得不错的性能。(2)对压缩激发模块进行变形和改造,使得模型从不同角度进行自适应。为了充分利用音频信号中不同维度的特征信息,对压缩激发模块进行变形操作。原始的压缩激发模块是为每个通道分配一个权重,本文新提出了时频压缩激发模块,为每个时频点特征向量分配一个权重。并将这两种不同维度的压缩激发模块以多种方式结合起来,以最大化利用音频信号中的特征信息。(3)为能够将模型有效应用于管制通话设备等小型嵌入式设备中,使用前沿轻量级卷积神经网络代替原本的普通卷积神经网络,在保持降噪性能只产生微小下降的前提下,有效减少模型的参数量,从而提高模型的可应用性。(4)为了更好地实现语音增强模型落地以及可视化展示,开发了一套原型系统,并将所提出的算法集成进去,用于实时展示。
其他文献
传统的聚类方法是浅层方法,其特征学习能力较弱。深度聚类将深度神经网络使应用于聚类任务中,将聚类目标和数据的特征提取过程相结合,极大的提高了聚类方法尤其是在高维度数据上的效果。但传统聚类算法依赖于被聚类数据集本身,无法借助外部信息。而无监督域适应方法为应对现有的深度聚类方法的瓶颈提出了新思路。通过从源域转移知识,可以提高未标记目标域上深度聚类的性能。目前的无监督域适应算法大多数存在以下两个缺点:(1
学位
联邦学习是当下针对机器学习中隐私安全保护和数据孤岛问题的主要解决方法,并在物联网、医疗和金融等领域广泛应用。对于联邦学习系统在应用过程中广泛存在的用户稳定性和分布式计算管理的问题,异步联邦学习是较实际的解决办法。本文主要研究在基于卷积神经网络的异步联邦学习场景下,客户端怎样根据环境和资源条件异步控制训练流程,有效的避免因客户端出错和数据通信导致的联邦学习系统的稳定性问题,并对异步场景下的恶意攻击中
学位
目前,我国装修市场迫切需要研发出能够代替人类进行复杂工作的装修机器人。装修机器人最重要的技术之一是自主导航技术,即在任何室内环境中,机器人具备快速到达目标点进行装修工作的能力。基于深度强化学习的自主导航技术利用机器人获得的环境信息,能够在无地图的情况下控制装修机器人快速到达目标位置完成导航任务。在之前的研究中,无论是利用基于视觉传感器还是或激光雷达传感器的深度强化学习导航算法,均存在两个亟待解决的
学位
现代无线通信技术依赖于自适应天线技术的发展。这影响了新时代的天线设计,以适应不断变化的射频环境。可重构天线就是这样一种设计,其工作频率、辐射方向图和极化方式可以根据用户的要求进行改变。MIMO(multiple input multiple output)成为研究的热门,因为MIMO天线在不需要增加额外功率或频带的情况下提高信道容量,当然这需要收发器都具有很多根天线,且天线间的耦合需要很小。因此M
学位
共识算法是区块链的重要组成部分。共识算法的建立不仅需要选择合理的共识节点,而且还需要完善的共识机制。现有的区块链网络中使用的Po W(工作量证明)以及Po S(权益证明)共识算法是算力和资产的证明。这种在节点之间作为竞争依据的证明方式不仅限制了区块链网络中的活力,而且极大地限制了普通节点加入共识网络,提高了节点加入区块链网络的门槛。虽然共识算法Po S(权益证明)、DPo S(委托权益证明)在共识
学位
基于生理信号的人体疲劳监测是指利用人体采集的生理电信号来判断受试者的疲劳程度。基于生理信号的疲劳监测因其客观性、可连续性等优势而具有很好的应用前景,但不同用户在性格、年龄等生理心理方面的差异,导致不同用户的生理信号具有差异。这种用户差异使得在已有用户上建立的人体疲劳监测模型直接用于新用户时稳定性变差。为此,本文提出了基于域适应(Domain Adaption)技术和基于域泛化(Domain Gen
学位
Android应用程序加壳是一种常见的Android应用软件代码保护技术,加壳后的Android应用原程序字节码被隐藏,可以防止敏感信息泄露,也可能被攻击者利用来隐藏恶意API进而绕过检测。当前主流的Android应用脱壳技术是非虚拟化保护技术,其脱壳方法主要是通过在固定脱壳点插入脱壳代码采集Dex文件信息并对其进行脱取,之后进行组装修复,而这种方法容易被反调试和反向劫持技术绕过。针对强度最高的虚
学位
指静脉是一种稳定安全的生物特征,在生活中有广泛的应用前景。目前指静脉识别技术的应用存在许多挑战,如:一、传统的指静脉特征提取算法基于手工设置的特征参数(静脉模式的几何和拓扑结构,局部二进制码等),算法的泛化能力不好,基于深度学习的方法在学习特征表示时,没有充分利用样本的类内和类间关系,算法的识别性能存在一定提升空间。二、基于红外传感器采集的指静脉图像容易出现对比度低、曝光过度、模糊等质量问题,因此
学位
由于世界各地对石油及其附属产品需求量的增加,石油的海上开采、运输更频繁导致海上溢油事故频发。因为溢油事故发生后表面浮油对海洋环境的负面影响最为直接,所以海洋溢油治理采取的一系列紧急措施都是针对表面浮油的去除,以期短时间内最大限度去除污染源。然而在紧急处理后仍会在海水中的残留一定量的溶解性石油烃(Dissolved Petroleum Hydrocarbons,DPH),在海洋水利条件影响下DPH发
学位
目的:分析淋巴瘤病人生命意义感在心理痛苦与生命质量间的调节效应,为提升病人的生命质量提供参考。方法:采用生命意义感量表、心理痛苦量表、淋巴瘤病人生命质量量表对350例淋巴瘤病人进行调查,并应用分层回归分析和简单斜率法分析三者间的关系。结果:淋巴瘤病人生命质量得分为(118.75±21.53)分,其中功能状况得分最低。淋巴瘤病人生命质量与生命意义感呈正相关(r=0.405,P<0.01),与心理痛苦
期刊