修正Mel频率映射的应力下变异语音识别方法

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:hopehappy501
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
众所周之,当话者因情绪,应力作用或Lombard效应而导致紧张时,语音识别算法的性能将会显著下降.为了提高变异情况下语音识别算法的性能,人们提出了许多方法.这些方法可以归纳为三类:1)顽健特征方法,2)变异补偿方法和3)模型调整方法.该文所进行的就是关于顽健特征的变异语音识别研究. 在各种语音变异中,话者在战斗机、航天飞机座舱等环境中,身体受到应力(重力)影响时的情况更具有特殊性.目前国内外有关应力影响下变异语音处理问题的专门研究还比较少.该文首先对特征提取作了介绍,说明Mel频率倒谱系数(Mel Frequency Cepstrum Coefficient简称MFCC)特征的提取过程.之后通过对应力影响下变异语音语图谱的分析,考察了变异语音共振峰的走势.接着用分频带分析实验的方法,确定由应力引起共振峰的变化,对语音各个频带识别性能的影响.通过以上分析,找到对变异语音识别性能较好的频带,用在推导Mel频率映射函数中,导出一个新的Mel频率映射函数,并将其对应 的MFCC系数作为新的语音识别特征,应用在应力影响下变异语音的识别中.通过实验,比较了基于新旧特征对应力下变异语音的识别效果.结果表明:采用新的映射函数M_Expolog计算出的MFCC特征,具有较好的顽健性(Robustness),有效地提高了变异语音的识别性能.对于受应力影响的语音,使用M_Expolog特征的平均识别率为85.5﹪,比没有使用该特征时提高了9.2﹪.
其他文献
该文首先给出了编译器中移植和重用的难点所在,然后介绍了编译器中基础设施之一:机器模型,并且提出了一种新的机器模型设计方法.我们在ORC中完全实现这一方法.然后该文结合ORC
随着计算机技术的应用不断深入到人们工作中的方方面面,工程设计单位或企业设计部门逐渐积累起了数量庞大的以电子形式存在的图纸和文档。但由于电子图纸、文档目前都分散存储
该文在全面分析了ERP系统的应用架构基础上,对应用中间件技术开发新一代ERP系统的进行了初步的探讨.针对当前企业信息化的需求模式、供应链、人力资源、客户关系、知识管理、
该文研究内容主要包括:1.提出一种对异质数据库、多媒体信息及其它信息源数据都适用的、统一的元数据表示模型.通过分析元数据的有关特性,比较现有元数据模型的局限性,用适合
学位
首先,该文从镜头边界检测的前期工作出发,提出了基于视频镜头特征的统计特征的视频预分类方法.分别提取视频压缩域和非压缩域的一些特征,将它们的统计特征组合成表征视频全局
该文介绍了信息家电与家庭无线网络的概念,信息家电服务平台的现状,比较了各种可用于家庭网络的无线通信技术,并说明了采用蓝牙协议建立家庭无线网络的优点.该文研究了蓝牙协
反射技术在LISP语言系统中第一次被提出,用以开放系统的实现,通过元对象协议对系统进行存取,从而实现可以动态配置系统.反射技术强调反省和自适应,即能根据自身的行为和特征,
数字视频图书馆是基于Internet的社会知识工程系统的一个组成部分,支持视频信息的收集、管理和存储,为Internet用户提供视频服务.其特点在于它所包含的视频信息存储容量大、
SNMPv3(Simple Network Management Protocol version3)是简单网络管理协议的第三版,它在安全性和管理能力这两个方面对SNMP进行了扩展,克服了SNMP的缺陷和问题,提供了鉴别、