抗噪声语音识别技术的研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:yaodmangrady
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
抗噪声的语音识别技术是语音识别系统走向实用化的一个关键性难题。现有的语音识别系统通常是为受控环境中的干净语音设计的,尽管它们在安静的环境里能取得很好的识别效果,但当存在环境噪声时,由于训练环境与识别环境的不匹配,其性能会急剧下降,在很多情况下无法满足实际应用的需要。本文对噪声环境中的语音识别技术进行了研究,其主要内容及成果如下: 1.针对MFCC(Mel-Frequency Cepstral Coefficient)和LPCC(Linear Prediction Cepstral Coefficient)特征在低信噪比时区分能力较差、使用模型补偿技术无法取得很高识别率的缺点,提出了基于单边自相关序列(one-sided autocorrelation,OSA)MFCC特征的模型补偿技术。实验结果表明,本文提出的模型补偿技术可以有效地提高OSA-MFCC的识别率,并且在低信噪比时其性能明显优于经过相同补偿处理的MFCC识别系统。 2.分析了环境噪声对相对自相关序列(Relative Autocorrelation Sequences,RAS)MFCC特征的影响,提出了基于RAS-MFCC特征的模型补偿技术。实验结果表明,所提的识别方法能有效地提高RAS-MFCC的性能,在低信噪比时其性能同样明显优于经过相同补偿处理的MFCC识别系统。 3.提出了一种基于MFCC特征的边缘概率(marginalisation)噪声语音识别技术。在提出的丢失数据(Missing Data,MD)技术中,对MFCC特征的每个分量采用了两个相互独立准则的联合判决结果来判定其可靠性,增加了判决的准确度。实验结果表明,所提的识别方法可以有效地提高MFCC识别系统的性能,并且在中高信噪比时比基于滤波器组(Filter Bank,FBANK)语音特征的边缘概率技术具有更高的平均识别率。 4.对边缘概率技术中的二元判决作了改进,提出了一种基于MFCC特征的软判决技术。在软判决技术中,根据本文所提的边缘概率技术中的两个判决准则,采用了一个基于规则的模糊逻辑系统来确定每个分量的可靠程度。实验结果表明,对于不同类型和信噪比的噪声,软判决技术的识别率都比基于滤波器组语音特征和MFCC特征的边缘概率技术有显著的提高。 5.提出了一种基于RAS-MFCC特征的边缘概率技术,实验结果表明所提识别方法可以有效地提高RAS-MFCC的识别率,并且其性能明显优于基于滤波器组语音特征和MFCC特征的边缘概率技术。
其他文献
黄瓜营养价值高,生熟食皆宜,十分适合长期食用,在我国各地种植广泛。本文对露地春黄瓜栽培中的关键技术环节进行详细介绍,包括品种选择、育苗、定植、田间管理和采收,对实际
目的分析门诊急性腹痛的内科诊治。方法随机选取68例急性腹痛患者,并根据诊治方式的不同,将68例患者分为研究组与对照组,各34例。研究组进行综合多平台诊治,依据急性腹痛患者
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
电导率是金属材料的重要物理量,电导率能有效的反映出金属的力学性能、热处理状态和腐蚀状态等参数,特别是在航天航空飞行器中,飞行器材料的电导率反映出的金属疲劳程度对于
目的观察依达拉奉对急性脑出血患者血清IL-1β、TNF-α的影响,探讨依达拉奉对出血性脑损伤的脑保护机制。方法用随机对照试验,随机分为治疗组和对照组,双抗体夹心ELISA法检测患
目的探究定期健康体检对改善老年人健康行为的效果。方法选取进行体检的老年人240例,根据其有无定期进行健康体检分为实验组和对照组,各120例,实验组120例老年人半年来进行过
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
肾绞痛是泌尿外科常见的急症,肾绞痛是由阻塞输尿管的结石导致一系列的临床表现。肾绞痛的诊断取决于患者的临床症状和影像学检查,甚至认为肾绞痛诊断代表一个放射诊断。超声