论文部分内容阅读
人体姿态估计与识别一直是计算机视觉极具挑战性的课题,近年来,深度学习技术的快速发展,极大地推动了该领域的研究。很多人体姿态估计算法关注的重点都单一地放在提高识别精度上,使其计算复杂度过高,这些算法大多使用多阶段的网络模型。网络结构过深虽然精度上得到提高,但是对于训练出来的模型参数却很大,无论是运行还是部署,都极大依赖硬件成本的投入。这些算法的复杂度主要来自于模型本身的设计复杂度和深度学习卷积网络参数计算。本文基于深度学习技术,旨在尽量保持算法精度的条件下,优化精炼网络结构,降低网络参数,构建轻量准确的人体姿态算法。首先使用深度分离卷积来代替普通的卷积计算,从而降低整个网络的参数量。同时设计端对端的网络对人体目标进行分析,进一步降低深度学习网络的规模,在特征提取方面,为了降低深度分离卷积带来的特征能力不足的影响,使用高效的沙漏模型的特征金字塔结构,最后对模型的参数量与精度进行了详细的分析,验证本文算法在降低网络参数与保持识别精度两个方面的有效性。以下是本文的主要内容:1)从静态图像与视频序列,单目标与复杂目标两个方向阐述当前人体姿态估计与识别的研究现状,并根据现有的算法分析姿态估计研究的目的和意义。2)分析卷积神经网络技术,通过基于卷积神经网络的图像处理算法与传统图像处理算法的对比分析,阐述轻量化网络的技术手段和高效率的特征提取技术。3)分析人体姿态估计的编码方法,对比自顶而下和自底而上两种算法路线的性能差异性,指出当前两种路线算法的研究重点与改进方法。4)在对人体姿态关键点提取的网络中,应用基于沙漏结构的金字塔残差网络,在设计特征提取网络中充分考虑多尺度特征,使得在网络参数降低时保持足够的检测特征,改善使用分离卷积带来的特征不足的影响;使用热力图对关键点进行检测和使用部分亲和力场解决多人姿态估计中的关键点规划问题。5)实验验证深度可分离卷积与具有沙漏模型的特征金字塔网络相结合的方法既能降低网络参数,同时能保持较高的识别精度。