论文部分内容阅读
随着计算机技术和通信技术的快速进步与发展,人们迫切地需求实现人与计算机之间的交互,就是要让机器能够听明白人类说出的话或者下达的命令,这就促使了语音识别技术得到了迅猛地发展和进步。经过60多年的研究和发展,语音识别技术的研究已经取得了一些较好的成果,但是要自然流畅地跟计算机进行语言交流还是存在一些难以解决的技术难题,有待相关专家和研究人员进行更进一步的研究和探索。本文首先介绍了语音识别技术的一些基本原理、关键技术及系统框架。从整体上研究和分析了语音识别系统的主要构成部分:预处理部分、特征提取部分、模型训练部分、模型参数库部分以及模式匹配部分。重点研究了LPCC特征参数和MFCC特征参数提取算法的详细推导过程及具体实现步骤。LPCC特征参数提取过程是先对语音信号进行线性编码技术LPC分析和计算,得到LPC系数,然后对其进行求倒谱得到LPCC系数。MFCC特征参数提取过程是对语音信号先进行FFT变换,然后经过MEL滤波器组,再进行取对数计算和DCT变换得到MFCC系数。另外,还介绍一种新型的特征参数——LPMFCC,其提取过程是上述两种特征参数提取过程的结合形式,即先求取LPC系数,再对其进行梅尔倒谱计算。在对比分析LPCC特征参数和MFCC特征参数的优缺点的基础上,提出了一种融合LPCC特征参数和MFCC特征参数提取算法——一种基于Fisher准则的融合特征参数提取算法,并设计了两种算法实现方案。本文的研究重点是对语音信号的特征参数提取算法的研究及改进。在对LPCC特征参数和MFCC特征参数提取算法的研究和分析的基础上,提出一种融合两者特征参数提取算法,评价其算法的优劣标准是对语音识别系统的识别率、时效性及抗噪性的影响。本文通过MATLAB仿真软件进行了大量的对比实验分析了这几种特征参数提取算法对语音识别系统的各方面性能的影响。实验结果表明,本文提出的基于Fisher准则的融合特征参数提取算法提取得到的特征参数比LPCC特征参数和MFCC特征参数能够更好地表征语音信号的特征,提高语音识别系统的识别率,对背景噪声的抗干扰性能也得到了加强,在系统的实效性方面影响不是很大,所以本文提出的融合特征参数提取算法更适合用于语音识别系统,能够更好地投入到实际应用中。