论文部分内容阅读
抑郁症是严重危害人类身心健康的精神疾病,具有高发病、高复发、高自杀率、高致残率和社会负担沉重等特点,然而大多数抑郁症状并未引起患者、家庭、医生的重视。一方面由于抑郁症状复杂,除了精神症状,往往同时存在生物性或躯体形式的症状;另一方面医生缺乏系统的抑郁障碍诊疗技术的训练,通常只是治疗患者的躯体症状和与此相关疾病,导致病情的延误。面部表情、眼睛注视和头部运动是估计抑郁程度的重要视觉信息,本文目的在于利用患者的视频信息预测其抑郁程度。本文制定了抑郁视频录制方案并采集患者视频,通过对卒中后抑郁视频数据进行分析,研究患者表情特征与抑郁程度的相关性,发掘典型的抑郁表情,并建立抑郁程度预测模型。本文工作主要包括单帧AU运动检测及概率估计,视频特征提取及视频序列分析,抑郁视频特征挖掘和抑郁程度预测四个部分。在单帧AU检测部分,本文训练出13种AU分类器,相比于以往的研究,扩大了AU的覆盖面,能够对抑郁症的面部运动模式进行更全面和深入的研究;此外,应用多分类概率估计方法估计AU出现的概率,相比于简单的二分类检测,提高了AU运动描述的精细度。在特征提取部分,本文引入HMM模型对视频序列进行分析,提取视频表情特征,相比于传统的单帧表情特征增加了时间维度。通过EM学习算法得到各AU的HMM模型参数,然后利用Viterbi算法估计AU的隐藏状态。由于考虑了视频前后帧之间的关系,提高了AU检测的精确度。在抑郁特征挖掘部分,本文不仅研究了单个AU特征与抑郁程度的相关性,得到与情感失调假说一致的结论,随着抑郁程度的加重,负愉悦度的行为会增加,而正愉悦度的行为会减少;而且增加了对多个AU同时出现时的一种典型表情笑容抑制与抑郁程度的关系研究,发现随着抑郁程度的增加,笑容抑制动作出现的频率会增加,表明抑郁患者有抑制自己愉悦情绪表达的倾向。在抑郁程度预测部分,在训练数据太少,回归模型性能很差的情况下,本文应用KNN分类的思想,对抑郁程度的五个等级进行预测,并在51段新的抑郁症视频上对比二者的预测性能,结果表明KNN模型更适用于对抑郁程度进行预测,在训练视频较少的情况下,仍能获得88%的准确性。