【摘 要】
:
语音情感识别要求从语音样本中提取情感特征参数,并采用一定的模式识别方法,识别语音中包含的情感类型。这是语音信号处理一个新兴的研究方向,具有广阔的应用前景。语音情感
论文部分内容阅读
语音情感识别要求从语音样本中提取情感特征参数,并采用一定的模式识别方法,识别语音中包含的情感类型。这是语音信号处理一个新兴的研究方向,具有广阔的应用前景。语音情感识别中,如何提取能有效反映情感信息的特征是最关键的问题,它直接决定识别的结果。本文用希尔伯特-黄变换(HHT)对情感语音进行处理,从整体上分析其特征,并在此基础上提取特征参数,进行文本无关和说话人无关的语音情感识别,取得满意的效果。具体内容如下:详细论述HHT的原理,揭示其本质特征和用于信号处理的优点。在此基础上提出边际能量的概念,并将其与边际谱一起用于分析情感语音。对高兴、生气、厌烦和平静四种情感语音进行统计分析,发现边际能量和边际谱分别反映情感语音在时域和频域的能量分布特征,能体现不同情感的内在规律。因此,将其作为情感识别的依据,在边际能量的基础上提取时域特征希尔伯特能量统计值(EHHT),在边际谱的基础上提取频域特征:子带能量(SE)、子带能量一阶差分(DSE)、子带能量倒谱系数(SECC)和子带能量倒谱系数的一阶差分(DSECC)。最后采用矢量量化(VQ)的方法,分别用上述特征做说话人无关、文本无关的语音情感识别。结果表明,单独使用时域特征或频域特征不能有效识别语音情感,而将此两种特征结合用于识别,能使识别率最高达到98.53%,且随码本尺寸的变化波动很小,效果相对稳定。本文将HHT用于情感语音处理,将时频特征结合用于语音情感识别,不仅提高了识别率,而且大大缩小了码本尺寸,具有一定的实际意义。
其他文献
在激烈的市场竞争环境下,职业教育若要得到长远的生存与发展,就需要立足地方经济产业并以企业为依托,将学生的培养与生产、服务、管理等进行有机融合,坚持以产学合作为导向的
光控相控阵天线系统,采用光真时延迟线技术实现天线单元间的微波光子移相,可以有效地抵消孔径渡越时间对雷达带宽的限制,从而实现天线波束宽带宽角度扫描。使用光真时延迟线
对基于协整理论的配对交易策略.本文将选取沪深300中的成分股作为标的,运用配对交易策略进行实证究.实证结果表明该策略适用于我国股票市场,为金融机构和个人投资者的投资行
市场经济体制的建立和完善,迫切需要规避价格风险的机制;货币和资本市场的不断发展,为大宗现货商品交易提供资金融通和建立结算体系创造了条件;点价升贴水交易与互联网化有效
电力线载波通信技术采用电力线传送数据和话音信号,由于其实现成本低、数据传输速率高、覆盖范围广而具有广阔的发展空间。为实现高速通信和可靠传输,多载波技术得到了广泛的应
MEMS器件的几何形状非常丰富与复杂,不同的几何形状为器件应用提供了有利的支持。本论文所重点研究的变截面双端固支梁,利用中间的大面积区域制作RF开关、光开关以及可变电容器
随着数字技术的快速发展,数字信号的工作频率已经达到微波频段,一根或一对互连线上传输的数据速率可达10Gbps以上。可以预见,在不久的将来,数据传输速率可以达到几十Gbps以上。而
土壤水分空间分布特征是土壤前期含水量模拟和小流域产流机制研究的重要内容,也是半干旱地区进行生态建设的重要参考。黄土高原广泛存在的土壤干化问题对人工生态系统的演化发
近年来,无线传感网络进入了快速发展的阶段。符合IEEE 802.15.4标准的无线传感网络的产品已经成功的市场化,成为市场的主流。IEEE 802.15.4标准规定了媒体访问控制层(MAC)和
同步定位与地图构建(SLAM:Simultaneous Localization and Mapping)是移动机器人的重要研究题目,单目视觉SLAM则是近几年的研究热点。传统的方法利用特征点或者特征线进行SLA