论文部分内容阅读
在计算机视觉与模式识别领域,视频人脸识别与视频人体行为识别问题始终是研究热点和难点问题。本文详细阐述了视频人脸识别及视频人体行为研究的工作进展,并基于目前的研究方法提出了若干视频人脸识别与行为识别算法,主要工作如下:1.无约束视频场景复杂多变、数据量大、设备不一致且环境不可控,使得视频中充斥着大量的遮挡和人脸旋转,导致人脸识别的准确率不高,性能不稳定且计算量较大。为解决上述问题,本文提出了一种基于QPSO优化的黎曼流形人脸识别算法。该算法将视频人脸识别视为图像集相似度度量问题,图像对齐后提取纹理特征并进行融合处理,再利用带有QPSO优化的黎曼流形大幅度简约维度以获得视频人脸的内在表示,相似度的度量则采用凸包距离标定方法,最后利用SVM获得最佳分类识别结果。通过在Youtube Face数据库上与当前几种主流算法进行的对比实验,验证了本文算法的有效性,所提算法识别精度较高,误差较低,并且具有较强的鲁棒性。2.针对传统基于特征提取的人体行为识别方法预处理操作复杂,导致人体行为脸识别的准确率不高的问题。本文提出一种基于多核3D-CNN的视频人体行为识别算法,该算法分别提取图像序列的灰度特征、梯度特征以及光流特征,同时,对三类特征序列采用不同的卷积核进行卷积操作以获得图像序列的多角度特征,构建3D-CNN网络后进行视频人体行为识别。通过在KTH数据库上与当前几种主流算法进行的对比实验,验证了本文算法的有效性。3.如何利用视频中的时空连续性信息设计有效的视频纹理描述算子是实现视频人脸识别及视频分析与理解的重要途径。本文提出了一种基于局部时空连续性聚合描述的视频人脸识别算法。该算法用图像集合表示视频,对图像集合划分分块,通过LBP-TOP算子提取视频的局部时空纹理特征,利用k-means算法获取该视频描述集合的聚类中心,基于这些聚类中心对视频描述集合进行聚合得到一个单独的向量,以得到更为细致的刻画视频的局部信息。特征向量之间的相似性是通过欧式距离来定义,并对不同分量赋予相应权重。最后利用最近邻方法获得最佳分类识别结果。通过在Honda/UCSD数据库上与当前几种主流视频描述算子进行的对比实验,证明所提出的视频描述子具有较强的可辨别能力。关研究的基础的上,提出了若干视频人脸识别算法与人体行为识别算法,并对目前该领域仍然存在的问题进行了总结,对今后视频分析与处理等领域的发展进行了展望。