语音情感特征提取与识别的研究

被引量 : 0次 | 上传用户:yishuiji111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音情感信息在人们日常生活和工作交流中起着重要作用。语音情感的分析和识别作为人机接口智能化的重要指标,是实现人工智能的关键问题之一,已经得到越来越多的学者关注,而且在诸多领域如远程教育、刑侦破案、医学领域、娱乐和服务业等得到应用。但是,目前语音情感识别的研究还存在较多的局限性,受到情感理论发展水平、语言自身的复杂性及相关学科的制约。因此,对语音情感识别的研究具有重要意义和应用价值。论文在与文本内容无关的语音情感库基础上,对情感特征的提取方法和识别两方面进行了研究。主要工作内容如下:(1)介绍了几类影响较大的语音情感库,研究了语音情感库的建立方法,建立了高兴、愤怒、生气和平静四种情感类型的语音库,包含800条情感语句。(2)研究了采用希尔伯特黄变换分析信号的方法。采用经验模态方法分解语音情感信号,得到本征模态函数,对本征模态函数进行希尔伯特变换后得到希尔伯特谱,说明了希尔伯特黄变换能够更好地反映信号的时频分布;对语音情感信号分别做经验模态分解EMD和改进算法EEMD分解,并通过对比分析,验证了改进算法的抗混叠能力。(3)阐述了基音周期、共振峰频率、线性预测倒谱系数和Mel频率倒谱系数等情感特征的特性和提取方法。把集合经验模态分解EEMD和希尔伯特Hilbert边际谱引入到非线性非平稳的语音信号处理中。利用人耳的掩蔽效应和Hilbert边际谱,本文提出了基于频带能量的情感边际谱。基于EEMD的情感边际谱在临界频段上分布更为集中和突出,可以有效地反映语音信号中的情感信息。(4)研究了语音情感识别的分类方法,提出了一种基于多策略和LibSVM的语音情感识别方法。该方法以离散情感模型为基础,根据特征值表征情感的能力与情感类型有关的特点,分级利用情感特征进行识别。通过实验证明基于多策略和支持向量机的识别方法能够提高情感识别的识别率。
其他文献
猫岭金矿是辽东重要的大型金矿床之一,其金储量为25t,平均品位为3.2g/t.猫岭金矿为毒砂浸染型金矿,毒砂与金矿化密切相关.猫岭金矿中6个毒砂样品的Re-Os等时线年龄为2316±14
复合坝作为一种兼有土石坝和混凝土坝优点的坝型,已广泛应用于工程中。复合坝的渗流问题涉及到土石坝段坝体渗流性态、混凝土坝段扬压力以及接合部位特殊结构的渗流等问题,对其
本文以长白山亚种林蛙蛙卵为实验材料,采用科学的试验方法对长白山亚种林蛙蛙卵进行了成分分析并确定了提取的有效成分为长白山亚种林蛙卵蛋白。采用了现代生物工程技术和纯
施工现场签证在工程建设中似小实大,本文从施工现场签证的概念、施工现场签证与变更通知单、工程签证的划分、施工现场签证的具体实施、现场签证费用预算的编制原则及处理方
川西盆地平落坝地下卤水是世界上罕见的富硼、富钾氯化物型卤水,资源储量居全国之首。综合开发利用川西盆地平落坝地下卤水可为国家提供锂、钾、硼等多种有用化工产品。本文
“三权分立”被认为是“资本主义国家的一种重要政治原则和政治制度”,但“三权分立”又如此广泛地存在于我们社会生活的各个领域中。我们应根据现实的发展,减少其内涵限制(以
胡麻是一种重要油料作物。该文主要介绍胡麻籽营养成分和抗营养成分及其研究应用进展,并提出当前胡麻籽研发中存在问题及今后发展方向。
安妮·勃朗特是十九世纪英国文学史上著名的“勃朗特三姐妹”之一,她创作了两部长篇小说和一些诗歌,其作品行文流畅隽永,语言凝练传神。要对其作品的艺术上的特点进行较为准确的
随着电力系统的高速发展,特别是电力电子与微电子装置的普遍应用,电力系统中愈发严重的电能质量污染与电能质量高要求的矛盾日益突出。广义有源电力滤波器是电力系统中全面提高
世界在发展,科技在进步,第三代无线通信已经大踏步向第四代通信迈进,手机等基本通信工具的用户数量已经非常庞大。随着数据流量业务与多媒体通信服务的兴起,适应需要的第四代移动