基于改进GMM在语音情感识别中的研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:DFHGFD43
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人机交互在现代社会越来越受关注,让计算机识别人类情感状态是实现智能互动的基础。语音是人类交往过程中信息交流、传递情感最自然有效的手段。语音情感识别研究不仅积极推进多学科交叉研究,更在人机交互等领域有着广泛的应用前景。   论文基于高斯混合模型对语音情感识别进行研究,总结了语音情感识别研究的发展趋势,深入分析了常用的情感特征参数及参数降维方法,通过改进高斯混合模型解决不同的问题,实现了语音情感识别效果的改善。   论文的主要工作和创新点如下:   (1)录制了一个汉语情感语音数据库,其中包含了高兴,悲伤,愤怒,害怕和中性五种不同的情感。经过实验证明,该数据库能够胜任语音情感识别的研究任务,为后续的语音情感识别研究提供了保障。   (2)针对高斯混合模型在训练数据不足、特征空间维数超过一定限度情况下性能受到较大影响的问题,引入多重判别分析对原始特征空间降维,同时有效的减少自由参数的数目,并在模型训练中引进Figueiredo-Jain算法解决了高斯分量个数的初始化难题。基于改进高斯混合模型的分类器取得了较好的识别效果。   (3)研究了高斯混合模型在样本有限情况下出现过适应的情形,引入基于Watson和Tellegen情感模型的距离度量,根据距离度量计算损失函数进行间隔缩放,并利用半定规划解决间隔缩放优化问题,增强了模型的泛化能力,有效改善了训练数据和测试数据存在统计失配时的分类识别性能。   (4)深入研究高斯混合模型处理不同长度时间序列的分类识别问题,针对它不能胜任存在混淆类或模型交叉的情形,引入支持向量机构造分类器,两者结合形成混合模型。以特定类高斯混合模型为基础构建改进的高斯混合模型,可以将不同长度时间序列转换成固定维数的得分向量。通过实验比较其性能,取得良好的效果。
其他文献
在日益复杂的现代战争环境下,雷达对微弱目标的检测与跟踪能力显得尤为重要,特别是在远程预警探测系统中。微弱目标的检测与跟踪不仅是获取情报的关键处理过程,而且是整个信息战
飞速发展的宽带和多天线技术通过深入挖掘频率和空间无线资源为无线移动用户以每秒百兆甚至千兆比特速率的通信提供了扎实的理论支撑。对无线通信高传信率、高频谱效率追求的
我国渔业发达,为了保护渔民的生命及财产安全,需要研制出更好的渔用通信设备。目前,我国渔业通信技术整体比较落后,不能完全满足现代渔业通信需要。本文研究全数字渔用超短波电台
在移动通信系统中,多点协作传输技术(CoMP)可以有效地减少系统中存在的干扰,而分布式天线技术(DAS)则可以在低功耗的情况下扩展信号覆盖范围。在实际应用中,为提高系统容量减少
M2M是“Machine to Machine”的简称,意为“机器到机器”。国际著名标准化组织3GPP(3rd Generation Partnership Project)将M2M通信定义为不需要人为参与的机器之间的数据通信
在MIMO无线通信系统中,各天线及各用户之间存在干扰,为了抑制用户间的共信道干扰(Co-ChannelInterference,CCI),需要基站根据所获得的信道状态信息(ChannelStateInformation,CSI)对
被动声纳主要是利用水中目标在航行过程中向外辐射的声信号对目标进行探测和识别。虽然电子技术和信号处理技术的飞速发展带动了声纳技术的高速发展,但是水中目标的分类识别仍
无线通信技术的高速发展给当今通讯带来了便利,但是在收发过程中存在着多径衰落,使信号在接收过程中形成码间串扰,造成波形失真,大大降低了通信质量。而均衡技术恰是解决码间串扰
随着验钞机行业新国标的颁布,传统验钞机的设计方案面临着许多问题。新国标要求验钞机具有很强的鉴别能力,因此对验钞机的软硬件要求大幅提高。基于新国标的要求,本文探讨了一种