论文部分内容阅读
所谓人脸表情识别,就是指通过分析特定人的脸部表情及变化,进而确定其内心情绪或思想活动,实现人机间更自然更智能化的交互。传统的表情模型的训练都是监督学习,然而在现实中,获得大量有标记的样本的代价是昂贵的,因此,如何利用仅有的少量已标记样本结合大量未标记样本来训练表情模型,使表情模型更具有代表性和普遍性,将具有重要的理论意义和实用价值。本文首先综述课题的研究背景,并分析目前国内外已提出的主流人脸表情识别方法。在综合分析了以往的表情训练方法和识别方法的基础上,本文设计实现了图像预处理和特征提取方法,提出了具有噪声过滤功能的协同训练半监督学习算法和基于对象模糊密度赋值的决策层融合人脸表情识别算法,主要内容如下:(1)设计实现了符合实际应用的人脸检测、人脸图像尺度归一化及人脸图像灰度均衡化算法和基于Gabor小波变换的人脸表情特征提取算法。将检测到的人脸设计成矩形,将人脸图像归一化为长宽都是5的倍数,用灰度均衡化减小光照对图像质量的影响。采用像素的矩形网格对预处理后的人脸图像网格化,将用Gabor小波变换变换每个网格后得到的特征矢量的模做为人脸表情的特征。(2)提出了具有噪声过滤功能的协同训练半监督主动学习算法。针对基于半监督学习的分类器利用未标记样本训练会引入噪声而使得分类性能下降的情形,提出了一种具有噪声过滤功能的协同训练半监督主动学习算法,该算法以三个模糊深隐马尔科夫模型进行协同半监督学习,在适当的时候主动引入一些人机交互来补充类别标记,来避免判决类别不相同时的拒判和初始时判决一致即认为正确的误判情形,同时加入噪声过滤机制,用以过滤由机器自动标记的可能是噪声的样本。图像序列人脸表情识别实验表明,该算法能有效提高未标记样本的利用率并降低半监督学习而引入的噪声,提高了表情识别的准确率。(3)提出了基于对象模糊密度赋值的决策融合算法。针对模糊积分在进行决策层融合识别时,其模糊密度是根据已知类别样本的先验静态信息赋值的,并不能根据具体对象的识别结果进行动态调整使之更接近现实的情形,提出了一种基于对象模糊密度赋值的决策层融合算法,该算法是利用各分类器识别具体对象时给出的客观信息计算出其所属类别的区分度,再结合先验静态信息对模糊密度进行动态赋值的。采用NF-CT-SSAL算法进行半监督训练和基于对象模糊密度赋值的决策层融合算法进行表情识别的实验结果表明,该算法可提高表情识别的准确率。(4)采用面向对象的设计方法,并应用所提出的算法,设计实现了基于图像序列的人脸表情识别原型系统,从而从实验角度验证了上述方法的有效性。