修正Mel频率映射的应力下变异语音识别方法

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户：hopehappy501

【摘要】

：

众所周之,当话者因情绪,应力作用或Lombard效应而导致紧张时,语音识别算法的性能将会显著下降.为了提高变异情况下语音识别算法的性能,人们提出了许多方法.这些方法可以归纳

【作者】

：

毕继武

【机构】

：

哈尔滨工业大学

【出处】

：

哈尔滨工业大学

【发表日期】

：

2002年期

【关键词】

：

变异语音识别应力 Mel频率 Mel频率倒谱系数特征提取

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

众所周之,当话者因情绪,应力作用或Lombard效应而导致紧张时,语音识别算法的性能将会显著下降.为了提高变异情况下语音识别算法的性能,人们提出了许多方法.这些方法可以归纳为三类：1）顽健特征方法,2）变异补偿方法和3）模型调整方法.该文所进行的就是关于顽健特征的变异语音识别研究. 在各种语音变异中,话者在战斗机、航天飞机座舱等环境中,身体受到应力（重力）影响时的情况更具有特殊性.目前国内外有关应力影响下变异语音处理问题的专门研究还比较少.该文首先对特征提取作了介绍,说明Mel频率倒谱系数（Mel Frequency Cepstrum Coefficient简称MFCC）特征的提取过程.之后通过对应力影响下变异语音语图谱的分析,考察了变异语音共振峰的走势.接着用分频带分析实验的方法,确定由应力引起共振峰的变化,对语音各个频带识别性能的影响.通过以上分析,找到对变异语音识别性能较好的频带,用在推导Mel频率映射函数中,导出一个新的Mel频率映射函数,并将其对应的MFCC系数作为新的语音识别特征,应用在应力影响下变异语音的识别中.通过实验,比较了基于新旧特征对应力下变异语音的识别效果.结果表明：采用新的映射函数M_Expolog计算出的MFCC特征,具有较好的顽健性（Robustness）,有效地提高了变异语音的识别性能.对于受应力影响的语音,使用M_Expolog特征的平均识别率为85.5﹪,比没有使用该特征时提高了9.2﹪.

其他文献

面向ORC编译器的机器模型的理论、设计和实现

该文首先给出了编译器中移植和重用的难点所在,然后介绍了编译器中基础设施之一：机器模型,并且提出了一种新的机器模型设计方法.我们在ORC中完全实现这一方法.然后该文结合ORC

学位

编译器机器模型软件重用软件移植微调度机器描述ORC

基于Internet/Intranet的图档管理系统的研究与实现

随着计算机技术的应用不断深入到人们工作中的方方面面，工程设计单位或企业设计部门逐渐积累起了数量庞大的以电子形式存在的图纸和文档。但由于电子图纸、文档目前都分散存储

学位

图档管理系统XMLCOM组件分布式应用

ERP系统中几个问题的研究

该文在全面分析了ERP系统的应用架构基础上,对应用中间件技术开发新一代ERP系统的进行了初步的探讨.针对当前企业信息化的需求模式、供应链、人力资源、客户关系、知识管理、

学位

企业资源计划中间件技术架构面向对象分布式CORBADCOMJ2EE

数据仓库技术的研究及应用

该文研究内容主要包括:1.提出一种对异质数据库、多媒体信息及其它信息源数据都适用的、统一的元数据表示模型.通过分析元数据的有关特性,比较现有元数据模型的局限性,用适合

学位

数据仓库元数据XML数据挖掘支持向量机

基于OpenCL的若干机器学习算法GPU实现及优化

学位

基于统计方法的视频结构分析

首先,该文从镜头边界检测的前期工作出发,提出了基于视频镜头特征的统计特征的视频预分类方法.分别提取视频压缩域和非压缩域的一些特征,将它们的统计特征组合成表征视频全局

学位

视频结构分析镜头边界检测视频预分类镜头特征镜头持续时间

基于蓝牙的家庭网络服务器技术的研究与实现

该文介绍了信息家电与家庭无线网络的概念,信息家电服务平台的现状,比较了各种可用于家庭网络的无线通信技术,并说明了采用蓝牙协议建立家庭无线网络的优点.该文研究了蓝牙协

学位

蓝牙技术蓝牙主控制器蓝牙主控制器接口层家庭无线网络蓝牙协议

基于反射的构件化中间件研究与开发

反射技术在LISP语言系统中第一次被提出,用以开放系统的实现,通过元对象协议对系统进行存取,从而实现可以动态配置系统.反射技术强调反省和自适应,即能根据自身的行为和特征,

学位

中间件电子注册反射技术构件技术

基于磁带库的数字视频图书馆存储系统

数字视频图书馆是基于Internet的社会知识工程系统的一个组成部分,支持视频信息的收集、管理和存储,为Internet用户提供视频服务.其特点在于它所包含的视频信息存储容量大、

学位

数字视频图书馆磁带库请求处理算法存储系统

SNMPv3基于安全远程密码协议的安全模型

SNMPv3(Simple Network Management Protocol version3)是简单网络管理协议的第三版,它在安全性和管理能力这两个方面对SNMP进行了扩展,克服了SNMP的缺陷和问题,提供了鉴别、

学位

安全远程密码协议网络管理SRP协议安全模型简单网络管理协议加密

修正Mel频率映射的应力下变异语音识别方法

其他学术论文