论文部分内容阅读
将人脸识别技术与视频检索技术结合,对监控视频进行智能分析,一方面可以拓展人脸识别技术的应用,另一方面可以实现视频监控的智能化。监控视频中的人通常是感兴趣的目标,而面对海量监控视频数据,人工审查方式耗时耗力却效果甚微。通过将人脸识别技术应用到视频检索中,对视频中的目标进行跟踪、分析并且及时发现异常行为,实现智能视频分析。 为了更好地结合人脸识别技术与视频检索技术,本文对人脸图像正规化技术进行了研究,初步实现了视频片段人脸检索。论文完成的工作主要包括以下几点: 研究了几何正规化处理的实现过程,眼睛定位是几何正规化处理的关键因素,眼睛定位不准会导致几何正规化失败并最终造成误识别,通过实验定量分析了人眼定位误差对人脸识别首位识别率的影响。实验表明,本文所采用的眼睛定位算法在一般情况下能够满足定位精度要求,但光照变化剧烈的情况下,该方法定位精度会有所下降。 研究并实现了5种光照正规化算法:直方图均衡化、对数边缘图、MSR算法、自商方法、TT算法。特别是对TT算法的原理和参数选择进行了深入研究,该算法可以理解为管理处理,依次是gamma校正、高斯差分图像、全局对比度增强。实验表明,全局对比度增强非常重要,通过该处理使得不同人脸图像的灰度对比度趋于归一化,增强了不同人脸的可区分性。 研究了光照正规化算法与GFC-Gabor特征的整合能力。以FERET、Yale和PIE人脸库为实验对象,从首位识别率角度对上述5种算法和GFC-Gabor特征的整合能力进行了比较。实验表明:TT算法与GFC-Gabor特征的整合能力最好,首位识别率均保持在90%以上,对于各种光照变化情况,产生的人脸识别系统鲁棒性最好。 研究了基于内容的视频检索的镜头检测和关键帧提取技术,结合人脸识别技术与视频检索技术,初步实现了视频片段人脸检索。实验结果表明,在较理想条件下,能够正确地检索出目标人脸,提供目标人脸的相关镜头。