论文部分内容阅读
语音情感信息在人们日常生活和工作交流中起着重要作用。语音情感的分析和识别作为人机接口智能化的重要指标,是实现人工智能的关键问题之一,已经得到越来越多的学者关注,而且在诸多领域如远程教育、刑侦破案、医学领域、娱乐和服务业等得到应用。但是,目前语音情感识别的研究还存在较多的局限性,受到情感理论发展水平、语言自身的复杂性及相关学科的制约。因此,对语音情感识别的研究具有重要意义和应用价值。论文在与文本内容无关的语音情感库基础上,对情感特征的提取方法和识别两方面进行了研究。主要工作内容如下:(1)介绍了几类影响较大的语音情感库,研究了语音情感库的建立方法,建立了高兴、愤怒、生气和平静四种情感类型的语音库,包含800条情感语句。(2)研究了采用希尔伯特黄变换分析信号的方法。采用经验模态方法分解语音情感信号,得到本征模态函数,对本征模态函数进行希尔伯特变换后得到希尔伯特谱,说明了希尔伯特黄变换能够更好地反映信号的时频分布;对语音情感信号分别做经验模态分解EMD和改进算法EEMD分解,并通过对比分析,验证了改进算法的抗混叠能力。(3)阐述了基音周期、共振峰频率、线性预测倒谱系数和Mel频率倒谱系数等情感特征的特性和提取方法。把集合经验模态分解EEMD和希尔伯特Hilbert边际谱引入到非线性非平稳的语音信号处理中。利用人耳的掩蔽效应和Hilbert边际谱,本文提出了基于频带能量的情感边际谱。基于EEMD的情感边际谱在临界频段上分布更为集中和突出,可以有效地反映语音信号中的情感信息。(4)研究了语音情感识别的分类方法,提出了一种基于多策略和LibSVM的语音情感识别方法。该方法以离散情感模型为基础,根据特征值表征情感的能力与情感类型有关的特点,分级利用情感特征进行识别。通过实验证明基于多策略和支持向量机的识别方法能够提高情感识别的识别率。