基于深度学习的双模态情感识别

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:i4majia
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
情感识别是多媒体信息处理、模式识别以及计算机视觉等领域的研究热点。随着深度学习、人工智能的发展,情感识别作为人机交互中的关键所在,受到研究人员的广泛关注。情感的表达方式多种多样,其中面部表情和语音是两种最为重要的情感载体,基于面部表情和语音的双模态情感识别研究具有重要的现实意义。本文主要针对面部表情和语音两种模态,研究深度学习在双模态情感识别方面的应用。主要工作如下:(1)为了避免传统面部表情识别中复杂的显示特征提取过程,对经典的卷积神经网络结构AlexNet进行改进,提出了一种基于改进AlexNet的面部表情识别方法;针对当前面部表情数据库样本量不充足的情况,研究了一种基于VGG-face模型微调的面部表情识别方法,使得样本数较小的数据集也能利用深层卷积神经网络获得更好的识别效果;考虑到面部表情的变化是一个循序渐进的过程,为了利用该变化过程中面部表情之间的相关性,进而研究了一种基于卷积神经网络和循环神经网络的面部表情识别方法。(2)为了提高语音情感识别的准确率,本文研究了一种基于卷积神经网络的语音情感识别方法,完成情感的分类;语音信号作为一种时序序列,在时间上具有很强的相关性,为了利用语音序列前后之间的相关性,研究了一种基于双向长短时间记忆网络的语音情感识别方法;为了综合长短时间记忆网络和卷积神经网络的优点,提出了一种基于长短时间记忆网络和卷积神经网络的语音情感识别方法。(3)以面部表情和语音两个模态为研究对象,分析比较了包括核典型相关分析、核矩阵融合、核交叉模型因子分析在内的特征融合算法以及基于加权的决策融合算法。选用eNTERFACE’05、RML、AFEW6.0三种双模态情感数据库进行实验验证,实验结果表明,借助融合方法得到的双模态情感识别结果比单模态情感识别结果有明显提高。
其他文献
动目标检测是雷达领域中一个十分活跃的研究热点,无论在军事上还是在民用中都具有非常重要的作用。它利用了目标回波中携带的多普勒信息,在频域实现目标和杂波的分离,它可以把位
业务提供是下一代网络中最关键的问题。下一代网络实现了业务提供、呼叫控制与承载连接的分离,软交换作为其核心技术具有无可比拟的优势。软交换设备可以提供一个开放式的业
近年来,无线通信发展迅猛,为了满足无线数据业务的巨大需求,需要发展更多更新的先进技术来增强无线通信系统的功能,扩大业务范围。 基于此,本论文分别从物理层 (PHY) 以及媒体
达芬奇技术的双核处理器架构模式为开发人员提供了数字视频处理所需要的大部分开发工具,包括ARM+DSP双核处理器,开发工具,Linux操作系统,视频处理算法软件和相关的技术支持。
随着计算机技术的发展,嵌入式系统已成为计算机领域的一个重要组成部分,并成为近年来新兴的研究的热点。ARM7TDMI 是一种高效,低功耗的 RISC 处理器。以该内核为核心的 S3C4510B
任何电信级的大型设备都对高可用性(HA,High Availability)提出了很高的要求。因此,通过各种通信协议联接起来的软交换体系中各部件的软硬件架构,尤其是软件模块的高可用性设