基于深度学习的人体姿态估计算法研究

来源 :电子科技大学 | 被引量 : 1次 | 上传用户:dkmlyn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体姿态估计是计算机视觉领域的一个非常基础的研究方向,应用十分广泛。本文首先对人体姿态估计的研究现状及现存的研究难点进行了分析,然后选取了2D多人人体姿态估计问题作为本文的研究重点,主要研究内容如下:1.本文的研究重点为使用深度学习技术解决2D多人人体姿态估计问题,为了便于后续的研究,首先对深度学习人体姿态估计及神经网络的一些基本知识进行了介绍。2.为了高效地解决2D多人人体姿态估计问题,即获得一个准确率较高,同时预测速度也较快的模型。首先对2D多人人体姿态估计算法中的自顶向下算法进行了研究,选择了高分辨率人体姿态估计网络模型,对它的基本原理进行了研究,另外采用了注意力机制及知识蒸馏对之进行改进。在原始高分辨率网络模型中引入了注意力机制,具体实现采用non_local模块完成,可以加强像素与其它像素之间的关联,从而提升模型对局部信息的区分能力,提高模型的准确率。此外使用了知识蒸馏方法,包含教师网络和学生网络两部分,教师网络和学生网络的骨干模型均为采用注意力机制改进的高分辨率人体姿态估计网络,但教师网络的参数量较多,学生网络的参数量较少。学生网络通过知识蒸馏方法可以从教师网络获取有用信息,从而可以获得一个参数量较少,准确率较高的模型,提升了模型落地的可行性。但在进行模型速度的测试时,发现模型的实时性还可以进一步提升,另外随着图片中人数的增多,模型的预测耗时也会显著增加。3.为了在高效地解决2D多人人体姿态估计问题的同时,降低图片中人数对模型的预测耗时的影响,对2D多人人体姿态估计算法中的自底向上算法进行了研究。选择了复合场人体姿态估计网络模型,对它的基本原理进行了研究,另外采用带孔卷积及shuffleNet V2网络对之进行了改进。首先使用shuffleNet V2网络作为骨干网络,替换了原始复合场人体姿态估计模型中的ResNet骨干网络,可以提升模型的预测速度。另外在使用shuffleNet V2网络作为骨干网络的复合场人体姿态估计网络模型中,又引入了带孔卷积,以便增大网络的感受野,从而提高网络的准确率。实验表明该模型拥有不错的准确率与速度,而且模型的预测耗时对于图片中人数的敏感性得到了降低。另外对于分辨率较低的图片,该算法仍具有一定效果。
其他文献
详细阐述了立管式间接初冷工艺流程、横管式间接初冷工艺流程、间冷-直冷相结合的初冷工艺流程及3种工艺的优缺点,为各焦化厂确定合适的煤气初冷工艺提供依据。
若想有效提高学生的思想政治综合素养,就要在当前的初中思想政治教育中积极做好学生的价值观、人生观以及世界观教育。只有始终坚持以学生文本,在初中思想政治教育中全面贯彻
随着现代信息技术的迅速发展以及人民生活水平的不断提高,智能手机逐渐成为人们生活中不可或缺的一部分。同时,随着研发人员的不断创新,学习软件的开发与使用受到广大智能手机用户的青睐。近几年,越来越多的研究者开始对学习软件进行探讨与研究。百词斩作为下载量最大的一个英语词汇学习软件,集图文、音频、视频、象形于一体,并且涵盖多种词汇学习策略,对学习者学习策略的使用有一定的启发。虽然高中生已有一定的英语基础,但
目的了解南京市浦口区居民高血压患病情况及影响因素。方法采用多阶段分层整群随机抽样的方法,随机抽取18岁以上常住居民进行一般状况、生活方式及行为、家族史等现况调查、
<正>杯芳烃及其衍生物因其独特的主客体识别性能而被广泛应用于色谱分离研究中。但由于绝大部分杯芳烃及其衍生物水溶性较差,目前它们主要被应用于反相色谱的相关研究中,关于