论文部分内容阅读
人脸关键点检测,即人脸对齐,已成为人工智能研究领域的一个热点。该技术实现了对于面部感兴趣特征点或区域进行定位的任务,以人脸检测技术得到的目标框为基础,进一步获得人脸关键点的确切位置。同时作为人脸验证、表情分析和人脸识别等技术的前趋步骤,人脸关键点检测为这些任务的研究提供精确的面部关键点定位。人脸关键点检测技术与生活、工业和商业应用密不可分。无论是监控设备、安防设备、身份验证设备等信息安全领域,还是图像处理等商业应用领域,均需要以人脸关键点检测的研究作为技术支撑。因此人脸关键点检测技术的研究具有极大的应用价值和实际意义,本文针对人脸关键点检测任务进行了以下三方面的技术改进:(1)首先以基于单步网络的SSD检测器为基础进行改进,添加了包含更多细节信息的、更靠近底层网络的特征层进行级联预测,来获得对于人脸的小目标检测任务的优良性能。其次,对于默认框的尺度进行调整,选择更加适合人脸形状的固定比例来实现默认框对于人脸更好的拟合效果。最后将改进后的方案在主流人脸数据集上进行实验对比以及性能改进分析。(2)本文对抑制冗余预测框的NMS算法进行改进。首先分析了NMS算法在人脸检测的小目标应用场景中可能导致的问题。其次,提出了将预测出的人脸框按照置信度分数分为三段的改进方案。对置信度分数处于最低段的预测框不再施加惩罚,保留其置信度分数不变,对处于中段和高段的预测框采用高斯函数进行重新打分的机制,实现对置信度分数不同程度的惩罚。最后在主流的人脸数据集以及USB摄像头实时场景中对整体改进后的SSD检测器进行实验对比以及性能改进分析。(3)本文采用改进后的SSD获得人脸的检测框,在此基础上,本文将速度性能优异的LBF关键点检测算法进行改进。首先采用LBF算法中使用的关键点区域的随机像素对的差值作为局部二值特征。其次本文提出基于像素差异的多角度初始化算法,对LBF架构的关键点检测算法进行优化。论文采用五组具有不同倾斜角度的关键点形状对人脸进行初始化,这种初始化方案可以实现对于多种倾斜角度的人脸优异的拟合效果。其后将五组初始化形状投入网络训练后得到五组预测形状,计算每一组形状中像素差异最大的眼部区域的方差值,选择方差最大值的预测方案作为最终预测所得的关键点位置。最后本文在主流的人脸关键点数据集以及USB摄像头实时场景中对整体改进后的人脸关键点检测架构进行实验对比以及性能改进分析。