基于深度学习的人体姿态估计研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:a123458a
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在计算机视觉研究领域,人体姿态估计技术是动作分析、人机交互、智能监控、医疗辅助分析、工业测量和电影特效制作等诸多应用的关键技术。随着深度学习以及卷积神经网络被应用于各种领域,该技术得到长足的发展,使用卷积神经网络模型来进行人体姿态估计的研究越发流行。本文基于人体姿态估计最新的网络模型,改进关键点定位算法,从两个方向出发研究人体姿态估计的问题。第一个方向针对于现在卷积神经网络越发复杂,为了能够获取更有用的信息,通过注意力机制的思想改进高分辨率网络模型,深入研究人体姿态估计问题;第二个方向,针对于对于不同尺度关键点定位精度低问题中,根据语义分割领域的尺度自适应思想,提出了针对于不同尺度关键点的尺度自适应热力图回归的方法,来进一步改进已有的高分辨率网络模型。并探讨了注意力机制和尺度自适应热力图回归两种机制结合的可能性。(1)在基于注意力机制研究人体姿态估计问题时,本文章是基于高分辨率网络基础上进行改进。高分辨网络模型的网络中有非常多的通道数不同的分支网络,结合归一化方法和注意力机制的通道域注意力思想,通过将高分辨率网络中的残差模块进行修改,使得模型能够关注通道中的上下文信息,学习基于不同通道权重的信息,提高了人体姿态估计的预测准确率。本文提出的基于通道域注意力机制的高分辨率模型在公开的MSCOCO数据集上进行了测试,准确率增长了1.5%。(2)在基于关键点定位精度问题中,本论文提出一种应用于语义分割研究领域的思想:尺度自适应热力图回归。该思想可以通过对不同关键点对应进行不同尺度的热力图回归,进一步提升人体姿态估计网络模型的平均正确率。本文章提出的基于尺度自适应热力图回归的网络模型在公开的MPII、MSCOCO数据集上进行了测试,可以在HRNet和Higher HRNet模型上增长0.7%准确率。并探讨和验证了注意力机制与尺度自适应回归结合的可能性,两者结合之后,对高分辨率网络的准确率提升了大约2.0%。
其他文献
目前焊接企业主要是通过人工来完成焊接信息的采集、监控并对焊接质量进行评估,成本高、效率低的同时,无法满足现代化焊接技术的需求。随着被称为信息物理系统融合的德国“工业4.0”的提出,我国提出了“中国制造2025”发展战略,工业生产将进入信息化、数字化、智能化的阶段,将智能生产和制造的实现视为现阶段发展的重点,随着各类智能传感器、无线通信技术在工业领域的广泛应用,以及深度学习理论在图像检测方向的发展趋
得益于大数据、大模型、GPU集群的推动,人工智能技术飞速发展,但是在此基础上训练出更准确、表达能力更强的优秀人工智能模型绝非易事。这也促进了并行化、分布式的机器学习技术飞速发展。目前的分布式机器学习框架中,计算节点的参数计算和参数通信过程是串行紧耦合的,造成计算资源利用率不高。同时随着近年来专用高速计算硬件设备的快速发展,计算能力的增长遥遥领先于网络数据传输能力,且高速的计算设备使得分布式机器学习
随着视频数据的逐步增加,利用人工筛查的方式进行目标行人的锁定和跟踪已经越来越难以适应大型视频监控系统。在逐步增长的海量视频数据中,如何自动化快速的进行目标行人的跨境检索问题是公安的迫切需求。本文从两个方面分析研究了行人跨镜检索问题,首先在第三章,研究在在单个摄像头下行人跟踪问题,然后第四章研究了在跨镜头下研究了行人重识别问题。在基于卷积神经网络的行人跟踪方向,目标跟踪器不仅要关注于感兴趣的区域,更
合成孔径雷达(Synthetic Aperture Radar,SAR)利用雷达与目标之间的相对运动接收被检测区域的回波进行成像。相对于光学成像,SAR成像系统具有不受天气,时间等影响等特点,能够在恶劣条件下对目标进行探测。因此SAR图像不论在军事还是在民用上的实际应用,都具有很大的价值。可以被使用于自然灾害评估、地貌检测、舰船检测、动目标跟踪、战场监控等。所以在SAR图像自动识别方面有着广阔的研
随着射频无线通信逐渐系统集成化、尺寸小型化、功能多样化,导致射频电路的结构复杂和工作频率升高。由于传统模型是基于Maxwell方程的全波分析法进行建模,电路模型消耗的计算资源增多,计算速度也明显变慢,使得设计人员对电路的仿真分析效率变低。因此,传统的射频电路建模分析方法已经逐渐无法满足电路高效快速的仿真分析设计需求。为了适应人们对高性能的射频电路模型日益迫切需求,基于人工神经网络建模方法逐渐受到人
稀疏码多分址(SCMA)技术能够提高频谱利用率,是5G无线通信中多址接入方案的重要候选者。信道估计是SCMA通信的关键过程,其精度和复杂度对系统有很大影响,但是经典的信道估计算法存在计算量大、性能差等问题,导致这些算法在SCMA的应用有局限性,所以研究适用于SCMA系统的信道估计算法有重要意义。而深度学习具有适应性强、高速并行等优点,深度学习与无线通信结合是目前信号处理领域的热点,并取得瞩目的效果
近年来,随着深度学习的发展,人工智能与人们的生活越来越紧密,在人脸识别、自动驾驶、医疗等领域已经得到了广泛的应用。与此同时,人工智能的安全问题也越来越突出。深度学习模型极易遭到对抗样本的攻击,攻击者只需对图像进行一些人眼无法识别的改动即可成功欺骗深度学习模型,从而导致深度学习模型给出错误的结果,进而引发极其严重的后果。针对这些攻击,研究了以下三种算法,其主要功能是通过对分类器网络增加一个额外的附加
多功能电子系统是由若干具有多种功能的电子设备所组成的多站点作战系统,各站点可协同工作,系统可根据任务需求对多个目标区域进行实时监视以应对潜在威胁,在现代战场上发挥着重要作用。各站点的分布将直接影响多功能电子系统的性能,通过优化站点位置可以有效提升系统的性能。然而,目前针对性能偏好要求下的站点优化配置的研究还不够充分,是一个亟需解决的问题。本文将基于粒子群算法对站点配置问题进行深入研究。具体内容如下
合成孔径雷达(Synthetic Aperture Radar,SAR)具有全天时、全天候的特点,在军用和民用领域有巨大的应用价值和研究意义。但是,SAR成像过程中,回波相干叠加、成像资源不足、雷达系统误差以及平台相对运动等不利因素会导致SAR图像出现质量退化效应,主要表现为斑点状噪声和分辨率下降,严重影响了SAR图像的信息提取与解释。近年来,深度学习飞速发展,在图像处理领域取得了突破性进展,对于
车位监测系统成本过高是制约传统停车场智能化改造的最大因素。本文通过分析市面上现有车位监测系统,研究出基于无线通信链路的车位监测系统,相比有线通信链路的车位监测系统具有更低的成本。为了提高车位监测系统的整体性价比,本文通过相关技术对比,最终确定以微波雷达传感器作为本系统的车位监测传感器,以ZigBee协议为本系统的网络通信协议,并根据停车场应用场景完成了车位监测传感器和ZigBee网络的系统参数设计