论文部分内容阅读
语音识别是人机接口设计的一项重要内容,也是语音信号处理中非常重要的应用技术。语音识别技术要走向实用必须解决语音信息的变化多样性(如用户多样性,方言口音等)问题和噪声问题。它们对语音识别技术有着严重的影响。一个特定系统针对不同的说话人,识别率可能相差几十个百分点。噪声带来训练模型和测试语音之间的失配,使得识别系统的性能急剧下降,如噪声可能使单词的端点检测造成困难,从而降低识别率。
为解决多用户不同口音语音的识别问题,本文提出了一种新的语音识别方法。新的算法充分考虑了误识语音。本文应用隐马尔可夫模型,在训练集中,对特别容易误识的语音增加其训练样本,而对不易误识的语音减少其训练样本,从而提高了语音识别系统的性能。
为减少环境噪声的影响,提出了基于离散余弦变换的语音增强算法,并将其应用于语音识别系统,增强了语音识别系统的鲁棒性。