论文部分内容阅读
人物识别的目的是身份鉴别,随着对人物识别的研究发展与普及,身份鉴别在各个领域中都有巨大的应用前景。目前对人物识别方面的研究主要针对人脸区域,在没有清晰人脸的情况下识别率非常低,因此本文深入分析了目前人物识别算法的研究现状,从多姿势方面入手,提取多姿势样本集和姿势特征,利用多姿势特征进行人物分类识别。在多姿势样本提取中,本文在基于poselets算法的基础之上提出了两种不同的方法进行姿势样本集提取。第一种方法是结合二分图最大权值匹配算法(P-BG),第二种方法是利用CNN特征和自然邻居流形排序的算法(P-CMR)。两种方法的不同之处在于通过根据特定位置人物头部标定框设置的过滤模型对图像中由poselets算法检出的人物框进行筛选后,P-BG算法利用筛选出的结果排序得分和二分图最大权值匹配算法对筛选结果进行匹配,找到特定位置的目标人物;P-CMR算法则对图像提取CNN特征,并利用自然邻居流形排序算法对图像特征进行排序,找出最优特征对应的图像即为特定位置的目标人物。最后,两种算法再对特定人物提取出对应的姿势。实验表明,本文的两种方法都能有效精确的检测出特定位置的人物,并提取出相应的人物姿势,而且第二种方法在人物被背景遮挡时的准确度略优于第一种方法。在特征提取过程中,本文针对不同部位的姿势采用不同的特征提取方法。与传统提取特征的算法相比,利用CNN(卷积神经网络)算法提取图像特征能更好的表达特征之间的相关性。本文对于非头部区域的姿势样本集采用Alexnet网络架构进行模型训练,对在ImageNet数据集上训练出的CNN模型进行微调;而属于头部区域的姿势样本集,则采用最新的VGGnet网络架构进行模型训练,由于样本数量的不足,因此在预训练好的VGG-face模型上直接进行微调。二者最终得到训练集一对应姿势的CNN模型,并在此模型上提取出训练集二和测试集的fc7层特征,用于后面的分类训练。在人物特征分类训练过程中,多维特征的组合很容易造成特征维度空间过大,数据处理缓慢,因此本文提出利用权值对姿势分类结果进行组合的方法进行人物识别。首先训练一个二分类SVM,得到每个姿势对应的权重值。然后,对测试集每个姿势的特征训练一个对应的多分类概率SVM(支持向量机)模型,得到对应的概率值,将每个姿势的概率值与其对应的权重值相结合,得到总的概率值即为最终的联合身份预测值。实验表明,本文算法在PIPA数据库上得到的人物分类准确度优于其他传统识别方法。