噪声环境下的语音识别算法研究

被引量 : 36次 | 上传用户：yeyuan1985

【摘要】

：

随着语音识别技术的快速发展,语音识别系统的性能得到了大幅度的提升,它作为一种方便、快捷、有效的人机交互方式,逐渐步入了人们的生活。然而,这些系统在实际使用过程中往往

【作者】

：

吕钊

【发表日期】

：

2011年01期

【关键词】

：

语音识别鲁棒性语音增强特征提取独立分量分析动态时间规整并行模型增强神经网络

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着语音识别技术的快速发展,语音识别系统的性能得到了大幅度的提升,它作为一种方便、快捷、有效的人机交互方式,逐渐步入了人们的生活。然而,这些系统在实际使用过程中往往会遇到识别环境和训练环境不匹配的情况,从而使得识别器性能急剧下降。因此,如何提高语音识别系统在背景噪声环境下的鲁棒性成为其走出实验室,走向人们生活的关键问题之一。本文在总结和分析现有鲁棒语音识别算法的基础上,依据噪声对语音识别系统的影响,从信号空间、特征空间及模型空间三个层面上展开了语音增强、特征增强及语音模型补偿＼增强等方面的研究工作,本文主要的工作及创新点如下：提出基于子带谱熵的噪声谱动态估计方法,改进了基于先验信噪比的维纳滤波算法。所提算法首先利用子带谱熵对带噪语音信号进行端点检测以区分有声段与无声段,在此基础上,对无声段数据逐帧地估计噪声功率谱并将当前帧所估计的功率谱与前一帧所估计的功率谱进行加权处理,以加权后的功率谱代替固定的噪声功率谱来进行先验信噪比估计。实验结果表明所提算法可以有效提高语音识别系统的识别正确率。研究了基于多次自相关运算的去噪算法,其目的是保证在去噪的同时而不改变语音信号的频谱结构。算法利用语音信号的多次自相关序列受噪声影响不大这一特点,提出了使用多次自相关后的观测序列来替代带噪语音信号序列作为语音识别系统输入,从而实现对噪声的抑制。本文给出了算法的推导过程,进行了不同相关次数下的语音识别实验,并对结果进行了分析。提出一种使用频域独立分量分析(Independent Component Analysis, ICA)的方法进行语音信号鲁棒特征提取的新算法,用以解决在卷积噪声环境下语音信号的训练与识别特征不匹配问题。该算法通过短时傅里叶变换(Short Time Fourier Transform, STFT)将带噪语音信号从时域转换到频域后,采用频域ICA方法从带噪语音的短时谱中分离出语音信号的短时谱,然后根据所得到的语音信号短时谱计算美尔倒谱系统(Mel Frequency Cepstrum Coefficient, MFCC)及其一阶差分作为特征参数。实验结果表明基于频域ICA方法的语音特征参数在卷积噪声环境下具有良好的鲁棒性。提出了一种基于动态时间规整(Dynamic Time Warping, DTW)的排序新方法,用以解决语音信号频域ICA算法中出现的排序模糊问题。这种方法依据相邻频点间信号具有较高相似度这一特点,通过采用动态时间规整技术实现对相邻频点数据的比较并根据比较结果调整排序位置,实验结果表明基于动态时间规整的排序算法能有效减少频域ICA算法中排序错误次数,提高分离语音质量。深入研究了在加性噪声与卷积噪声环境下使用并行模型合并算法(Parallel Model Combination, PMC)进行模型补偿的基本原理,推导了两种情况下算法的实现过程；提出了一种基于双通道的卷积环境下噪声估计的新方法,即首先在参考通道内使用频域ICA方法作对语音和噪声的短时谱进行分离,然后在主通道内使用带噪语音信号短时谱减去由参考通道所估计的“纯净”语音信号短时谱即可得到噪声的短时谱。实验部分验证了卷积环境下噪声估计的准确性,语音识别结果表明PMC模型补偿算法可以有效提高语音识别系统在噪声环境下的鲁棒性。提出了并行子带隐马尔可夫模型(Hidden Markov Model, HMM)和神经网络(Neural Network, NN)混合的鲁棒语音识别模型,用以解决语音识别系统在噪声环境下当部分频带受到干扰时,基于全频带HMM的语音识别系统的识别率将会下降这一问题。混合模型是将全频带的HMM分解成许多子带HMM,并在每个子带上独立地进行语音识别,然后根据多个子带的输出再次提取出一些新的特征参数,通过神经网络对这些参数进行融合来产生一个全局的决策结果。语音识别实验结果表明,所提混合模型在噪声环境下具有较强的鲁棒性。

其他文献

POSP综合管理系统的设计与实现

销售终端(POS)是一种多功能银行终端,一般安装在银行特约商户及受理网点中,具有消费、预授权、转账、查询等功能。大力发展POS业务是银行提高中间业务收入的重要手段。销售终

学位

销售终端销售终端前置系统管理信息系统

当前民粹主义逆全球化思潮的反思与中国应对方案——基于列宁民粹主义与全球化批判的视角

在当前欧美民粹主义大行其道,逆全球化浪潮涌动的历史性转折点上,针对其现状与危害,基于列宁对俄国民粹派的村社社会主义“逆全球化”观批判的视角,运用马克思列宁主义的阶级

期刊

列宁民粹主义逆全球化思潮批判

自杀者

<正> 第一幕一天晚上,在新经济政策时期失了业的市民谢苗·波谢卡尼科夫和他的妻子玛丽娅,鲁克娅诺夫娜躺在自己家里的床上。谢苗不时地叫醒妻子,一遍又一遍地问她,午饭时吃

期刊

阿里斯亚历山大低音号克里姆林宫

陀螺稳定吊舱控制系统设计与实现

陀螺稳定吊舱近几年发展十分迅速,它是集光、机、电于一体的复杂系统。陀螺稳定吊舱的主要任务是保持视轴的稳定以及实现对机动目标的跟踪。本文设计了基于PC104嵌入式计算机

学位

陀螺稳定吊舱PC104嵌入式计算机光纤陀螺滤波Fuzzy-PID复合控制

供给侧改革下的商业作为

王成荣:会议今天给我们几位出了一个话题:“供给侧改革商业的作为”。这个话题很大,这个话题也很难,这个话题也是商业课题,怎么破解这样一个题目,不是我们今天几位能够给出一

期刊

供给侧改革第一个全聚德国家大剧院王成荣餐饮企业

成铁局基层员工激励机制优化研究

本文在研读、分析西方经典激励理论的基础上,综合运用管理学和经济学理论方法,紧密联系成都铁路局“人本管理”中激励实践中的具体问题,结合当代企业新的经营管理环境的特点

学位

激励机制优化保障性住房基层员工成都铁路局

新时期儿童文学中的苦难叙述

新时期以来,随着文学观念的转变,儿童文学界出现了大批描写苦难的作品。小主人公被放到了社会动荡的大背景下,他们的生活中充满了辛酸与苦涩、泪水与伤痛,但同时又不缺乏温暖

学位

爱引渡者祸不单行意象姿态力度

大学教师职称评审模式探析

随着我国高等教育改革的步伐行进,我们的大学教师职称评审制度也在不断的发展。①从发展历史来看,大学教师职称评审制度主要经历了教师职务任命制、教师职务评定制和教师职务

学位

职称评审评审模式法律原则制度建设法律救济

《孙子兵法》中行政领导思想初探

《孙子兵法》是一部伟大而又神奇的著作。自从《孙子兵法》诞生以来,人们对它的研究和应用就从没有间断过。从古时军事战争中的取胜教科书,演变成现代经营管理中的生存宝典,

学位

孙子兵法行政领导领导职能领导艺术

生活化教学的反思研究

近几年来,在生活性、发展性、生命性等新课改理念的影响下,生活化教学话语不断被强化,有诠释过度的倾向,一些人把“生活化”视为教学的金科玉律,好像不谈“生活化”就无权言

学位

生活化教学反思

噪声环境下的语音识别算法研究

其他学术论文