论文部分内容阅读
语音识别技术就是为了实现让计算机听得懂人说的话,并能做出相应的回馈,语音识别是实现人机交互最重要的一步。语音识别系统通常分为预处理、特征提取、分类器的设计、模板匹配四个步骤。通过预处理得到更清晰的语音信息,提取能够反映语音本质的特征以及设计精度更高的分类器,都对语音识别的性能具有重要影响。
本文针对非特定人孤立词的语音识别系统,分别从语音特征选择与多分类器融合的角度对语音识别技术进行研究,并取得了以下成果:
(1)基于粗糙集理论的属性约简算法对语音特征进行研究,提出了一种基于粗糙集理论的语音特征选择方法,并通过特征选择得到了一组语音特征。实验结果表明,这种语音特征选择方法有效地降低了特征的维数,使用选取到的语音特征,可以得到较好的识别效果,从而验证了此特征选择方法的有效性。
(2)提出一种基于多分类器融合的语音识别方法,该方法使用SVM,RBF神经网络与贝叶斯网络作为成员分类器,根据样本库中抽取的校验集计算各成员分类器的权值,以加权评分的投票策略进行决策融合。实验结果表明,通过多分类器融合的识别结果明显优于单个分类器,从而验证提出的多分类器加权融合的方法是一种有效的语音识别方法。
(3)设计了一个非特定人孤立词的语音识别实验系统。该系统具有语音样本采集、预处理、特征提取与组合、模型训练、语音识别的功能。即将采集到的语音信息进行后台处理,最终得到一组特征向量,并导入分类器中与训练模型进行比对,最终得到识别结果。而对样本库的训练样本事先进行离线处理,从而得到匹配模型,以便待测样本进行模式匹配。