基于YOLOv3剪枝模型的姿态和步态识别算法研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:qazxc123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在计算机视觉的模式识别中,目标检测是一个非常具有挑战性并且极具现实意义的的研究方向。多人姿态估计作为计算机视觉领域的一个重要组成部分,也影响着很多其它研究方向,包括但不限于人机交互、体感技术等。随着当下全球化的趋势愈加明显,安全问题也日益严峻,相比较于其它用于伪装身份的方法,步态由于其不可伪装性、远距离性等特点成为了当下各国安全的研究重点。近年来,随着计算机软硬件的大力发展和数据量的爆炸式增长,深度学习在计算机视觉领域表现十分优异,基于深度学习的多人姿态估计和步态识别方法也在各个领域发挥出重要的作用。论文首先介绍了多人姿态估计和步态识别技术的研究背景和意义,详细阐述了国内外的研究现状,包括主流的步态识别算法,并对当前技术存在的问题进行了分析;随着卷积神经网络和深度学习在计算机领域的大放光彩,论文仔细介绍了深度学习的基本理论知识和重要概念。本文主要展开了以下两方面的工作和创新:(1)首先提出了基于YOLOv3(You Only Look Once v3)的多人姿态估计算法(YOLO Pose Estimator,YLPE),针对算法存在的参数量过大和计算冗余等问题,进一步提出了基于模型剪枝的多人姿态估计算法(YOLOv3 Prune Pose Estimator,YLPPE)。该算法采用自顶向下框架,利用YOLOv3网络对多人图片进行人体目标检测,将检测所得人体包围框通过裁剪、补零等操作生成新的256?256大小的单人图片,最后将单人图片依次输入堆叠沙漏网络(Stacked Hourglass Network,SHN)进行人体关节点检测,并利用中心点回归法则将检测到的关节点回归至原始图片。该算法利用批量归一化(Batch Normalization,BN)层的缩放因子对YOLOv3网络进行循环迭代式通道剪枝,给BN层的每一个通道引入缩放因子,将缩放因子较小的通道视为冗余通道并移除,从而大幅降低网络的整体计算量。通过对剪枝后模型进行实验验证,YOLOv3剪枝模型参数量下降46%,但精度只下降了0.5%。YLPE算法在MPII数据集上达到了84.1m AP,而YLPPE算法为83.7m AP。同时,算法与Deeper Cut模型、RMPE模型等进行比较也获得了较为明显的精度领先。(2)提出了基于HP-GSI融合的步态识别算法。当前步态识别的主流方法是基于人体姿态(Human Posture,HP)和基于步态轮廓图(Gait Silhouette Image,GSI)两类,前者存在关节点定位不准确等问题,而后者受行人穿着和视角影响较大,针对上述问题论文提出了一种基于HPGSI融合的步态识别算法,其中算法所用数据集是由YLPPE算法对原始CASIA-B步态数据集进行图片尺寸裁剪和关节点信息提取所得。算法基于卷积神经网络实现的HP步态识别模块和GSI步态识别模块,其中,模块分别采用了集合池化(Set Pooling,SP)层结合完整步态周期图片特征,从而获得步态的时序特征。将视频分别输入这两个模块获得识别置信度和识别结果,再采用改进AND的决策层特征融合方法,得到最终检测结果。基于HP-GSI融合的行人步态识别算法在CASIA-B数据集上达到了75.8m AP,相比较于单独识别模块有了一定提升,证明了特征融合的有效性。
其他文献
烟草是茄科烟草属植物,具有极高的药用价值和经济价值,烟草产业也为我国财政收入做出了巨大贡献。烟草的产量和品质直接影响了其价值。烟草生长至一定阶段,就会由营养生长转变为生殖生长,此时烟草体内大部分的营养物质就会被运输至顶端,叶片、茎、根系生长滞后,而烟草的主要利用价值在于叶片,为了使烟草在栽培中一直进行营养生长,多年来人们探索出来的最有效的也是运用最广泛的方法是打顶,原理是在烟草长出花序后的一段时间
基于位置服务(Location Based Service,LBS)是物联网发展的热点之一。现实生活中,地理位置是人行为活动的重要基础,并且人的活动约有80%时间是在室内进行的。因此,只要能够成
随着通用目标检测技术的不断发展,对规范图片的目标检测能力已经大幅提升,然而在很多人为的特定场景中,目标往往是不规律且难以检测的。而这些场景往往更具有工程应用意义,例
随着互联网技术的普及和手机等移动终端设备的智能化,越来越多的传统业务开始向线上电子商务模式发展。从早年传统的B2B、B2C,到当下流行的O2O,都强烈地吸引着企业经营者们的
本文首先明确了破产受偿制度的概念,并阐明其特征与价值;其次,通过对典型案例的分析,总结出我国破产受偿制度在实践中遇到的主要问题,即债权地位设置不合理、受偿顺序规定有冲突、受偿范围界定不明确等。针对实践中的主要问题,本文从我国破产受偿制度的立法现状以及理论辨析的角度对诸问题产生的原因进行了分析,并针对性的提出了完善建议:其一,应当通过建立债权优先级和担保债权的结算规则去平衡破产清算程序中各主体间的利
城市广场是市民活动的载体和精神文明的窗口。城市广场视觉信息媒体属于广场重要的窗口设施,是以一定的媒体介质载体形态来表现文字、图像与信息符号等视觉信息要素。应用生
关于北祁连南蛇绿岩带蛇绿岩,前人多认为是形成于洋中脊环境的早古生代大洋岩石圈残片。本次对川刺沟A型花岗岩和其周围超基性岩的研究,有助于较全面认识该区时代序列与构造格架。川刺沟A型花岗岩的组成矿物为碱性长石(45 vol.%)、石英(30 vol.%)、斜长石(15 vol.%)以及少量的霓辉石(5vol.%)等,发育条纹、显微文象和蠕虫等结构。岩石具有高SiO_2(72.5873.96wt%)和高
随着计算机视觉领域向人工智能的方向发展,人们需要更灵活的策略来应对现实世界中物体分类的大规模性和动态性。至少,当新类别的训练数据被引入时,分类网络应该能够增量式地
随着互联网的发展,越来越多的服务从线下转移到线上,传统纸质合同签署受时间空间约束的弊端愈发凸显,电子合同在线签署的方式可以有效解决传统纸质合同的弊端,因此建设一个可
随着医药、畜牧和水产养殖的发展,环境中抗生素残留问题日益突出,相伴而生的抗生素和重金属的复合污染成为环境中的一种普遍现象。同时,生物炭是一种优良的吸附剂,在抗生素和重金属污染的修复发面具有广泛的应用前景。本研究选取环境中检出率较高的磺胺甲噁唑(SMX)和Cu(Ⅱ)为目标污染物,采用玉米秸秆为生物质原料,分别在300℃和600℃热解炭化制得生物炭(分别标记为BC300和BC600),并用HCl对其进