论文部分内容阅读
语音识别技术在实验室环境下获得了良好的系统性能,但是应用环境的复杂性严重影响了语音识别的性能,同时当前基于计算机软件和在线语音识别系统受到应用设备条件等限制,因此开发鲁棒、小型化、离线的语音识别系统,具有重要的应用价值。本文针对以上问题,主要研究基于多环境模型矢量泰勒级数特征补偿的鲁棒语音识别系统以及在嵌入式系统上的开发和移植,同时实现基于ARM A8平台的优化,以此提高语音识别系统的适用性。 论文的主要研究工作如下: (1)研究了语音识别系统结构、性能评价参数和鲁棒识别技术。本论文使用了基于短时能量和短时过零率的双门限端点检测。选择美尔倒谱系数(MFCC,Mel-Frequency Cepstral Coefficients)以及一阶差分MFCC作为本论文使用的特征参数,利用隐马尔科夫HMM(Hidden Markov Model)模型作为声学模型,选择ARM A8作为开发平台,并选择嵌入式Linux系统作为片上开发系统。 (2)分析了多环境模型的矢量泰勒级数(VTS,Vector Taylor Series)特征补偿算法,完成ARM A8硬件开发环境的搭建,实现了基于ARM A8和多模型VTS特征补偿的非特定人孤立词识别系统,包括音频处理模块,预处理模块、端点检测模块、特征提取模块、多环境模型特征补偿模块和识别模块,并进行了仿真测试和结果分析。 (3)优化了基于ARM A8和多环境特征补偿的嵌入式语音识别系统,其中分为硬件配置优化和算法优化。在硬件配置优化部分完成基于浮点库和基于协处理器两种优化。在算法优化部分完成对数指数运算的优化,关于最佳迭代次数的优化,匹配模型选择的优化,识别模块算法的优化。分别测试优化方法前后的性能差异,并分析其中差异发生的原因。通过设定对优化方案的组合,达到实时语音识别以及环境适应性的要求。