基于核分析方法的语音情感识别的研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:clast
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展和人机交互研究的深入,实现计算机智能识别人类情感变得越来越重要,它也是实现人工智能的基础。语音信号是人与人之间交流的重要方式之一,它的作用不仅仅是传递语义,而且它还承载了说话者的个人情感特征。语音情感识别是一个涉及多学科交叉的研究领域,它在实际的生产生活中具有广泛的应用前景。  本文主要对基于核方法模型的语音情感识别进行了研究,回顾了语音情感理论的研究历程和发展历程,构建了汉语语音情感库,分析了常用的语音情感特征和降维方法,并且将改进的核方法用在情感识别当中,提高了情感识别的准确度。  论文的主要工作和创新点如下:  (1)简述了语音情感识别的研究背景和研究意义,对情感的定义、语音的产生过程、以及常用的情感特征和识别模型等进行了概括和总结。  (2)录制了实验室的五种基本情感的汉语情感语音库,其中包含了愤怒、害怕、悲伤、中性、高兴五种情感,并经过听辨实验保证了数据的可靠性和有效性,该语音库为后续的实验提供了实验素材。对语音数据进行了预处理,提取了情感特征,包括能量、基音频率、Mel频率等参数,组成了情感特征矢量,用于后续的情感识别实验中。  (3)针对一般的主元分析只能解决线性可分的样本分类问题,引入核函数变换,将数据映射到高维空间后再进行主元分析,提高了识别效率;由Fisher线性鉴别分析的原理,引入了典型相关分析(CCA)和核主元分析相结合的方法解决类内散度矩阵奇异的问题,实验证明该方法对于情感识别具有良好的识别效果。  (4)研究了支持向量机与核方法相结合的语音情感识别,将核方法应用到支持向量机上能够使分类器的性能更加强大。由于奇异或者含有噪声的样本可能会影响超平面方程的训练,出现过拟合的情况,通过PIM(partition index maximization)训练算法引入模糊因子,改进基于核方法的支持向量机,将PIM-FSVM应用到情感识别之中,从而减小过拟合的发生概率,改善了分类器的性能。  (5)由于核函数的形式对于情感识别的有着很大的影响,因此针对高斯径向基核函数,引入评判标准,根据样本训练得到不同参数的核函数,从而提高分类性能。引入多核技术,针对L1 MKL存在的不足,通过利用松弛因子构建软间隔的多核(MKL)的目标函数,采用迭代算法求解组合系数和超平面方程。同时提出了将上述两种方法结合,将训练出来的高斯核函数用于构建MKL的基核,用于语音情感识别中,对比实验验证了该算法的良好效果。
其他文献
通信和信息技术的发展促使计算机快速进入我国的各级教育管理部门。目前国内高校几乎全部都已建立校园网,并在网上进行日常的教学管理、图书管理、财务管理等,使教师、家长和学
当前,随着宽带技术的普及和发展,基于MPLS的虚拟专用网技术越来越引起了人们的广泛关注。MPLS VPN是一种基于MPLS技术的VPN,是在网络路由和交换设备上应用MPLS技术,简化核心路由
学位
本文在系统研究数字接收机、虚拟无线电、信号处理等理论的基础上,设计了一个虚拟无线电接收机,实现了基于该接收机的16QAM信号解调算法的仿真。系统设计中采用当前比较先进
本文对Ad hoc网络路由协议进行了研究。文章详细分析了DSDV中的目的节点序列号机制、DSR中的源路由机制和AODV中的逐跳机制,从多径路由的角度出发,对当前Adhoc网络中的多径路由
盲源分离(Blind Source Separation)是近二十年迅速发展起来的一种新兴技术,它在没有源信号与传输信道的任何先验知识的前提下,仅利用观测信号恢复出源信号。其被广泛应用于