基于改进LP倒谱特征和神经网络的语音识别算法研究

来源 :太原理工大学 | 被引量 : 12次 | 上传用户:zxc569148889
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别是近年来高速发展的一项技术,但由于其研究的复杂性,长期以来一直是一项难题,尤其是噪声环境下的非特定人语音识别。本文从一个典型的语音识别系统出发,介绍了语音识别的基本原理,讨论了几种常用的特征提取、模式匹配及模型训练的方法,并对其常规算法进行了改进。 LP倒谱是语音识别技术中应用广泛的特征参数,但在噪音环境下,系统的识别率会显著下降。由于Mel频率尺度可较充分地反映人耳对频率及幅度的非线性感知特性,以及人耳在听到复杂声音时所表现的频率分析和谱合成特性。本文对LPCC特征提取方法进行改进,即将LP倒谱按符合人耳听觉特性的Mel尺度进行非线性变换,得到LP Mel倒谱系数(LPMCC)作为特征参数。实验结果表明此种方法抗噪性能好,识别效果高。 径向基神经网络是一种新颖有效的前馈式神经网络,本文详尽的介绍了常规聚类训练算法和全监督训练算法,并分别用这两种算法进行语音识别系统的仿真试验。实验显示在相同环境下,用全监督训练算法使结果有了显著的提高,充分说明了全监督训练算法对RBF网络的性能提高有较大的作用,使RBF网络具备了更强的分类能力。但缺点是训练速度较慢,可在以后的研究中加以改进。 小波神经网络是结合小波变换理论与人工神经网络思想而构造出来的一种“新型的神经网络模型”,融合了小波变换良好的时频局域化
其他文献
随着现代遥感技术的发展,各种对地观测卫星源源不断地提供不同空间分辨率、时间分辨率、波谱分辨率的遥感图像。为了对观测目标有一个更加全面、清晰、准确的理解和认识,人们迫切希望寻找一种综合利用各类图像数据的技术方法,因此图像融合技术应运而生。图像融合技术是一种新兴的、前沿的、热门的、带有一定难度和探索性的技术,具有广泛的应用前景。本文首先介绍了遥感图像融合的基本理论和方法,对图像融合的预处理采用了简单易
随着无线通信网络技术的不断发展,基于位置的服务引起了产业界的广大关注。无线网络定位技术需要对大量的传感数据进行采样和处理,而现有的定位技术在系统能量消耗与实时性要
支持向量机是上世纪九十年代提出的一种基于小样本的新的统计学习方法。本论文通过引入一种新的基于支持向量机的多类分类方法来解决音频中的多类分类问题,同时将该方法与传
随着计算机技术的发展以及对信息安全要求的不断提高,基于生物特征识别技术的在线签名验证技术以其非侵犯、使用方便、应用范围广等优点越来越受到人们的关注。 在线手写