论文部分内容阅读
计算机硬件的发展推动了深度学习技术在图像识别领域的进步,基于卷积神经网络的图像分类,人脸识别方法取得了显著性的成果。近年来,随着人工智能,多媒体等技术的快速发展,监控视频在家庭安防、金融安全、智能出行等领域得到了广泛的应用,基于监控视频中人脸特征的分析成为学者们研究的热点领域。传统研究方法中大多忽视了监控视频对识别实时性能的需求,并且很少同时实现对多种属性的研究以及对属性数据相对较少问题的进一步解决。因此,本文主要对监控视频中的人脸属性分析的实时性和准确性进行研究,并从图像生成角度解决数据量相对较少的问题,进一步优化属性分析的模型。主要研究内容如下: 一、从监控视频人脸数据的构成、特点、应用领域和国内外人脸研究的现状等方面,说明了基于监控视频人脸数据进行属性分析的重要意义。总结了对监控视频人脸数据进行属性分析的网络结构的选择方法,详细介绍了基于Multi-task思想的Lighten CNN单网络多目标的网络结构的构建。并阐述了人脸特征分析的几个重要的评价指标。 二、使用了基于BEGAN,CycleGAN的人脸属性数据的生成方法。因为现有监控视频数据相对较少,对最终模型的准确率影响较大。为了降低数据对最终人脸属性特征分析结果的影响,结合当前流行的生成对抗网络思想,使用目前在人脸生成领域效果最好的BEGAN网络,进行监控视频中人脸属性数据的生成。在这一策略中,提出用现有监控视频数据与开源数据集CelebA融合的方法,进行BEGAN网络的训练,并使用最优的迭代模型,模拟噪声输入,生成人脸属性数据。将生成的人脸数据添加到原始的监控视频数据集中,基于拓充的数据,进行属性模型的优化。同时,使用CycleGAN模型进行人脸戴眼镜属性,戴口罩属性数据的生成。实验结果表明,生成的人脸属性数据在清晰度和细节程度上都具有较高的真实性,基于拓充的属性数据集,性别模型得到进一步优化。 三、设计了一种基于阈值的模型训练样本拓充的半自动化数据标注策略。因为原始的手工标注方法带来繁重的工作负担。模型训练、样本拓充的方法使用少量人工标注的数据进行训练,通过模型在未标注的数据上进行预测,得到在各个类别上的概率值。基于阈值的策略使得模型对预测概率大于指定阈值的样本进行自动的属性类别标注。实验结果表明,基于阈值的策略在保证数据标注精度的同时,减轻了人工标注的负担,优化了模型的识别效果。最后使用优化的模型进行监控视频人脸序列的可信度分析。