论文部分内容阅读
随着计算机技术的广泛应用,语音识别技术得到了快速发展。目前的语音识别系统对纯净语音可以达到非常高的识别精度,但是无处不在的噪声带来了训练模型和测试语音之间的失配,识别器在噪声环境中性能将会急剧下降,带来识别准确率的降低,因此噪声环境下语音识别技术的研究显得尤为重要。
本论文讨论了三种重要的语音特征参数:线性预测系数(LPC)、线性预测倒谱系数(LPCC)、Mel频率倒谱系数(MFCC);讨论了语音识别中两种常用的识别方法:基于模板的动态时间规整(DTW)和基于统计模型的隐马尔可夫模型(HMM);讨论了三种基本的抗噪语音识别方法:语音增强抗噪方法、噪声环境下模型补偿法和提取抗噪的语音特征法。论文选用MFCC参数作为特征,利用HMM对孤立词进行训练和识别,并对孤立词语音识别系统进行了仿真。基于以上研究,对端点检测算法进行了改进,提出了基于短时互相关函数的端点检测算法,该算法利用短时互相关函数从背景噪声中检测出元音部分,以元音的起点和终点作为语音实际端点的参考端点,根据一般情况下语音信号中元音和辅音能量比例相对平稳的特性检测到辅音,从而确定实际语音信号的端点。仿真实验结果表明,基于短时互相关函数的端点检测算法与基于能量的端点检测方法相比,可以在不同信噪比下提高端点检测的准确率,同时在检测基音频率变化范围大的男、女声语音信号时,准确率也有所提高,但是该算法的实时性较差。