论文部分内容阅读
语音识别是近年来高速发展的一项技术,但由于其研究的复杂性,长期以来一直是一项难题,尤其是噪声环境下的非特定人语音识别。本文从一个典型的语音识别系统出发,介绍了语音识别的基本原理,讨论了几种常用的特征提取、模式匹配及模型训练的方法,并对其常规算法进行了改进。 LP倒谱是语音识别技术中应用广泛的特征参数,但在噪音环境下,系统的识别率会显著下降。由于Mel频率尺度可较充分地反映人耳对频率及幅度的非线性感知特性,以及人耳在听到复杂声音时所表现的频率分析和谱合成特性。本文对LPCC特征提取方法进行改进,即将LP倒谱按符合人耳听觉特性的Mel尺度进行非线性变换,得到LP Mel倒谱系数(LPMCC)作为特征参数。实验结果表明此种方法抗噪性能好,识别效果高。 径向基神经网络是一种新颖有效的前馈式神经网络,本文详尽的介绍了常规聚类训练算法和全监督训练算法,并分别用这两种算法进行语音识别系统的仿真试验。实验显示在相同环境下,用全监督训练算法使结果有了显著的提高,充分说明了全监督训练算法对RBF网络的性能提高有较大的作用,使RBF网络具备了更强的分类能力。但缺点是训练速度较慢,可在以后的研究中加以改进。 小波神经网络是结合小波变换理论与人工神经网络思想而构造出来的一种“新型的神经网络模型”,融合了小波变换良好的时频局域化