基于循环神经网络的民航陆空通话语音识别研究

来源 :中国民用航空飞行学院 | 被引量 : 1次 | 上传用户:zhjjchj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
陆空通话是管制员与飞行员进行信息交流的主要通讯方式,保障通话的准确性是维护空中安全、提高飞行效率的关键。无线电干扰、航行噪音、语速以及管制疲劳等原因造成管制指令表述和理解错误而导致航空安全事件不断发生,因此将陆空管制通话经过语音识别技术处理,转化为管制指令文本具有实际应用价值。本文基于循环神经网络模型对陆空通话语音识别进行了研究:本文基于端到端的循环神经网络模型,分别将双向循环神经网络(Bidirectional recurrent neural network,Bi RNN)、双向长短时记忆(Bidirectional Long Short-term Memory,Bi LSTM)、双向门控循环单元(Bidirectional Gated Circulation Unit,Bi GRU)与连结时序分类(Connection Timing Classification,CTC)相结合来构建声学模型。实验结果表明,BIGRUCTC模型的整体性能更优,在良好的识别结果基础上,其训练复杂度低且训练时长也较短,更适用于民航陆空通话语音识别任务。针对民航领域的语音数据难以获取,直接训练获得的声学模型识别效果不理想且泛化效果差等问题。本文基于迁移学习(Transfer learning)的策略,在开源数据集上进行声学模型训练,将模型训练参数储存并迁移到民航领域的语音数据集中训练;同时采用数据增强(Data Enhancement)的方法对训练数据进行扩展,增强声学模型的泛化能力和鲁棒性。实验结果表明,融合了数据增强与迁移学习策略的Bi GRU-CTC模型在民航语音数据集上有良好的表现。端到端的循环神经网络模型是一种依赖数据驱动的模型,直接对文本建模没有很好的利用到其中语言知识。本文将Bi GRU-CTC声学模型与GRU语言模型进行融合,单独训练语言模型对整个识别系统进行语义补充,能进一步提升语音识别效果。
其他文献
党的十九大提出乡村振兴战略,这是关系到“全面建设社会主义现代化国家的全局性、历史性任务”,是“实现中华民族伟大复兴的一项重大任务”。乡村振兴提出的二十字方针以及社会治理能力现代化和治理体系现代化目标具有相同性。无论是乡村振兴或是社会治理,都是一项长期、复杂的系统性问题,实现农村场域的振兴,现代化是必然要求。农村场域是重点、更是难点,必须办好农村的事情,关键要加强农村基层党组织建设,既是实现乡村振兴
期刊
乡村治理是国家治理的基石。随着乡村建设的推进,党建引领下“自治、法治、德治、数治”四治融合的乡村治理体系逐步形成。同时,党建引领乡村治理“四治融合”建设还面临着不少的难题需要破解,尤其是面向新征程中的乡村现代化建设,在社会深度转型、推进乡村治理现代化进程中,党建引领乡村治理“四治融合”体系建设在理念策略、主体协同、方法效能等方面都面临一定的制约。新时代加强和改进乡村治理“四治融合”建设,需要强化基
期刊
水滴在航空器及输电设施表面聚集,可能会在结构件表面结冰或使电气设备短路,给人们的正常生产生活带来巨大安全隐患。主动式除冰方案虽然得到了广泛应用,但它具有耗能高,成本高和结构复杂等诸多缺点。因此,需要研究具有疏水性能的被动式防冰方案,其主要疏水机理是利用涂层技术改变固体表面化学性质或者对固体表面进行微观形貌构造,得到具有抗润湿性的疏水结构。疏水表面的微观结构可减小固液接触面积,延缓传热过程,从而推迟
学位
苦荞中富含蛋白质、淀粉、黄酮类物质及膳食纤维等多种营养素。尤其是荞麦蛋白具有降血糖、调节血脂、增强人体免疫力等作用。但研究已证实人体摄入苦荞蛋白后可能会引起机体过敏反应,成为制约苦荞产品开发亟待解决的问题。目前,发酵被认为是能够有效降低食物过敏反应的加工手段之一,通过改变、破坏、掩藏和修饰过敏原表位可以降低食物的致敏性。本文通过对自然发酵的苦荞酸面团中微生物多样性分析,筛选出潜在的具有降低致敏性的
学位
针对民用机场外来飞行物入侵的危害,以及机场范围内监控外来飞行物的设备自动化程度较低、价格昂贵等特点,本文通过结合机场范围内弱小运动目标检测、基于平行光轴双目运动目标位置计算、弱小运动目标轨迹预测分析与风险值计算等完成了机场外来飞行物的追踪与预测研究。首先分析大视场下弱小目标的时空成像特征,在时序上对像素灰度值进行统计学变换、在空间上对变换后相对灰度值进行固定阈值和最大类间阈值两次阈值生成,实现目标
学位
目的 基于自我决定理论,探究护士组织沉默的影响因素及改善对策。方法 采用一般资料调查表、护士组织沉默测评问卷和护士职业认同评定量表,于2021年5月对西安市某综合性三甲医院458名护士进行问卷调查。采用多元线性回归分析护士组织沉默的影响因素,基于自我决定理论提出组织沉默改善对策。结果 护士组织沉默总均分为(54.88±13.88)分,处于中等水平,组织沉默受性别、科室和职业认同感的影响(均P<0.
期刊
碳纤维增强复合材料(Carbon Fiber Reinforced Plastics,CFRP)由碳纤维增强体和树脂等基体复合而成,由于其具有区别于传统材料的一系列优良性能而被广泛应用于各行各业。比如在航空业中,CFRP被应用于飞机机身、机翼等至关重要的结构部位。而在CFRP的制备和使用过程中不可避免地会出现各种损伤,进而降低材料在使用过程中的安全性。目前对CFRP进行无损检测已成为当前业内关注的
学位
3-甲基丁醛是切达奶酪产生坚果风味的关键香气化合物。乳酸乳球菌作为发酵剂应用于切达奶酪的生产,可以有效提高奶酪中3-甲基丁醛的含量。然而,在乳酸乳球菌中,3-甲基丁醛通过哪些基因所编码的蛋白合成,其合成途径又是受哪些因素所调控等尚未证实。基于此,本课题从测定乳酸乳球菌生产3-甲基丁醛的产量差异出发,通过关键酶活性测定、全基因组测序、氨基酸序列比对、定量PCR实验、大肠杆菌中蛋白的异源表达等多种分子
学位
全球导航卫星系统(Global Navigation Satellite System,GNSS)提供的位置、速度和时间服务具有精度高、全天候等特点,被广泛应用于生活的各个方面。因此,其服务的安全性变得越来越重要。然而,因为卫星导航信号在到达地球时变得极其微弱,所以它们很容易受到干扰。针对卫星导航信号中可能遇到的干扰源信号进行快速检测与识别,这对整个干扰监测系统建设以及提高导航系统抗干扰性能都有重
学位
富硒茶比普通茶具有更好的感官品质、生物活性以及经济效益,但是由于富硒土壤具有地域差异,天然富硒茶的产量难以满足人们的日常需求。同时,由于土壤环境会影响硒的生物有效性,叶面施硒已经成为茶树强化硒元素的一种安全、低成本、高效方便的方法。然而,目前大多数研究主要集中在亚硒酸钠(Se4+)或硒酸钠(Se6+)的应用,而对于其它硒源在茶树硒强化中的应用研究较少。本文通过比较一种新型硒源——氨基葡萄糖硒(Gl
学位