论文部分内容阅读
伴随着人机交互技术的快速发展,语音用户界面(Voice User Interface,VUI)逐步成为国内外的研究热点。借助VUI系统,改变传统的键盘输入模式,代之以语音输入的方式,人机交互更加的便捷和人性化。然而实际应用中环境噪声复杂,VUI往往会遇到识别和训练环境不相匹配的情况,从而使得语音识别率较低。因此,本文将经验模态分解(Empirical Mode Decomposition,EMD)、希尔伯特-黄变化(Hilbert-Huang Transform,HHT)以及双麦克风噪声干扰对消技术相结合。提高了VUI系统在强噪声环境下的识别率,从而给飞机辅助维修设备提供可靠的人机交互。本文的主要研究内容如下:第一,针对VUI系统在国内外的研究现状和发展趋势,分析了目前民用航空辅助维修的需求,阐述了存在的实际问题和需要改进的方面。第二,以往的语音端点检测算法一般是利用语音信号的短时能量、短时平均过零率等时域特征参数。能量计算方法不尽合理,且在低信噪比情况下识别效果较差。本文研究了基于EMD和Teager能量算子的语音端点检测技术,该方法结合EMD和Teager能量算子在表征非线性非平稳信号上的优势,EMD分解语音信号实现初步去噪,然后利用Teager能量来代替短时能量进行端点检测。第三,在去噪处理方面,传统的方法是用单一麦克风获取带噪语音,然后进行小波变换、谱减等。考虑到飞机维修现场的噪声频域分布更广、幅度更大等特性,本文引入双麦克风自适应噪声对消技术,一路麦克风采集带噪语音,一路麦克风采集背景噪声,利用递归最小二乘(Recursive Least Square,RLS)自适应算法,在时域上对消两路信号,最大程度去除噪声成分,保留有效语音,最终实现信噪比的提高。第四,详细阐述了基于以上两种技术的VUI系统各模块实现过程以及相互之间的通信方式。该设计采用客户端-服务器端(C/S)结构,有效地利用了客户端和服务器端的负载。通过对隐马尔科夫模型(Hidden Markov Mode,HMM)的10次自适应训练,从语音模板、噪声门限值和二次识别语音库这三个方面进行改进,对语音信号进行测试实验,给出了本文所设计VUI的识别率测试结果。分析表明,该VUI系统具有更强的抗噪性能,在识别率测试上较以往的VUI系统有5%左右的提高。