论文部分内容阅读
抗噪声的语音识别技术是语音识别系统走向实用化的一个关键性难题。现有的语音识别系统通常是为受控环境中的干净语音设计的,尽管它们在安静的环境里能取得很好的识别效果,但当存在环境噪声时,由于训练环境与识别环境的不匹配,其性能会急剧下降,在很多情况下无法满足实际应用的需要。本文对噪声环境中的语音识别技术进行了研究,其主要内容及成果如下: 1.针对MFCC(Mel-Frequency Cepstral Coefficient)和LPCC(Linear Prediction Cepstral Coefficient)特征在低信噪比时区分能力较差、使用模型补偿技术无法取得很高识别率的缺点,提出了基于单边自相关序列(one-sided autocorrelation,OSA)MFCC特征的模型补偿技术。实验结果表明,本文提出的模型补偿技术可以有效地提高OSA-MFCC的识别率,并且在低信噪比时其性能明显优于经过相同补偿处理的MFCC识别系统。 2.分析了环境噪声对相对自相关序列(Relative Autocorrelation Sequences,RAS)MFCC特征的影响,提出了基于RAS-MFCC特征的模型补偿技术。实验结果表明,所提的识别方法能有效地提高RAS-MFCC的性能,在低信噪比时其性能同样明显优于经过相同补偿处理的MFCC识别系统。 3.提出了一种基于MFCC特征的边缘概率(marginalisation)噪声语音识别技术。在提出的丢失数据(Missing Data,MD)技术中,对MFCC特征的每个分量采用了两个相互独立准则的联合判决结果来判定其可靠性,增加了判决的准确度。实验结果表明,所提的识别方法可以有效地提高MFCC识别系统的性能,并且在中高信噪比时比基于滤波器组(Filter Bank,FBANK)语音特征的边缘概率技术具有更高的平均识别率。 4.对边缘概率技术中的二元判决作了改进,提出了一种基于MFCC特征的软判决技术。在软判决技术中,根据本文所提的边缘概率技术中的两个判决准则,采用了一个基于规则的模糊逻辑系统来确定每个分量的可靠程度。实验结果表明,对于不同类型和信噪比的噪声,软判决技术的识别率都比基于滤波器组语音特征和MFCC特征的边缘概率技术有显著的提高。 5.提出了一种基于RAS-MFCC特征的边缘概率技术,实验结果表明所提识别方法可以有效地提高RAS-MFCC的识别率,并且其性能明显优于基于滤波器组语音特征和MFCC特征的边缘概率技术。