基于多分支卷积神经网络的人体姿态估计研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:z8566612
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现代多媒体技术的发展,图像已经成为了信息最重要的载体之一。如何有效识别和理解图像中的人体相关信息成为了现代计算机视觉研究的重点。人体姿态估计任务的目标是预测图像或视频中的人体关键点位置,通过关键点组成的铰链式结构表达人体姿态。人体姿态估计作为人体行为识别、人体跟踪等任务的基础,一直是计算机视觉领域的研究重点。同时,人体姿态估计也具有巨大的实际应用价值,被广泛应用于人机交互、游戏娱乐以及体育赛事分析等场景。为了满足不同场景下的应用需求,本文的研究内容主要分为如下两部分。针对多人2D人体姿态估计中人体检测框利用率不高,人体姿态估计结果存在量化误差的问题,本文提出了一种基于多分支自校准网络的算法。在人体检测阶段,本文通过基于竞争机制的后处理算法来保留适度冗余的人体检测框,通过综合考虑人体检测和姿态估计结果来选取全局最优解。在人体姿态估计阶段,传统的单分支网络随着输出分辨率的下降,量化误差不断扩大,性能急剧恶化。本文设计了一种联合位置热力图和位置偏移量预测的多分支网络,通过有效且直观的策略对两个分支的结果进行融合得到最终的姿态。在模型融合阶段,本文提出同时利用投票机制和加权平均算法提升多模型融合的精确度。在公开数据集上的实验表明,本文提出的方法达到了领先的水平。针对3D人体姿态估计存在的数据集缺失和解空间复杂的问题,本文提出了一种基于多分支深度可感知网络的算法。在网络结构方面,本文通过多分支结构将3D人体姿态估计任务拆解为2D坐标预测和深度感知两部分,降低了问题求解的复杂性。同时,多分支结构的设计使得模型训练可以利用2D数据进行弱监督。在训练策略方面,为了避免不同分支相互干扰导致模型不收敛,本文采用了多阶段训练的策略。在损失函数方面,本文引入了多种几何约束限制解空间范围,提高了模型对于复杂姿态的识别精度。在公开数据集上的实验表明,本文提出的方法取得了有竞争力的结果。
其他文献
目的 分析宫腔镜手术治疗子宫黏膜下肌瘤的疗效与安全性.方法 选取本院2018年1月至2020年12月的62例子宫黏膜下肌瘤患者,根据不同术式分为宫腔镜组(n=31)与腹腔镜组(n=31),两组分别行宫腔镜手术与腹腔镜手术,对比其手术指标(手术时间、出血量、排气时间、住院时间)、并发症发生情况(疼痛、宫腔感染、子宫穿孔、宫腔粘连)、月经改善率与肌层愈合率、性功能(BISF-W评分).结果 宫腔镜组的手术时间、出血量、排气时间、住院时间(42.23±10.22分钟、29.12±5.27ml、12.42±4.1
目的 研究掌侧微创入路结合锁定钢板治疗桡骨远端骨折手术方法和临床的疗效.方法 总结分析2015年3月至2019年8月共52例桡骨远端骨折的患者,均采用掌侧微创入路,取患者腕部掌侧做长约1.5-2.0cm左右的正中稍偏桡侧切口,保留旋前方肌,手法复位或者翘拨复位,选用掌侧桡骨远端解剖板固定.结果 本组52例患者均获得随访,随访时间平均12.5(11-15)个月,骨折愈合时间平均3.8(3-6)个月.切口均Ⅰ期愈合,未出现术后切口开裂、神经血管损伤、钢板断裂、骨不连等并发症.结论 掌侧微创入路在治疗桡骨远端骨
目的 对原发性腹膜后肿瘤(PRT)患者进行MR结合DWI及其ADC值检查,对其临床应用价值进行评估.方法 选取医院2016年6月至2020年6月收治的61例PRT患者资料进行回顾性分析,结合病理学诊断结果,分析其MR表现、DWI信号特点及其ADC值等影像学特征,对其应用价值进行评估.结果 经病理学诊断61例腹膜后肿瘤中42例为恶性病变,19例为良性病变.MR-DWI诊断恶性病变为40例,良性病变为21例,良恶性诊断符合率为95.1%(58/61).MR-DWI诊断的AUC、敏感度、特异度分别为0.984、
人脸识别作为人工智能与机器视觉的关键应用领域,因其非接触性、可操作性以及简便性而具有较高的实际应用价值,被广泛应用在安防、金融、娱乐等领域。然而在现实场景下,不同的光照变化仍会对人脸识别产生巨大的影响,导致识别准确率降低,是领域内亟需解决的问题。本文从数据集、图像处理以及识别网络三个环节入手,利用深度学习方法进行光照人脸识别的研究。本文的主要工作如下:(1)针对当前公开人脸数据集存在的光照纯度低、
目的 探究胸部CT扫描后图像处理对肋骨骨折患者的诊断效果.方法 将本院收治的90例疑似创伤性肋骨骨折患者设为研究对象,进行CT胸部扫描,采用肺窗、纵膈纵隔窗和骨窗技术对肋骨骨折部位进行肋骨重建,使用多层面重建(MPR)、容积再现(VR)和最大密度投影(MIP)CT图像后处理技术,检测患者确诊人数、部位和骨折数.结果 90例疑似肋骨骨折患者中共确诊81例(90.00%),其中MPR检测75例(83.33%)、VR检测72例(80.00%)和MIP检测73例(81.11%)低于联合诊断检测79例(87.78%
雷达辐射源信号分选是指对接收机接收、截获到的交错混叠辐射源信号流进行信号处理,从而将同一个辐射源发射出的信号分为相同类别。在目前的信息化时代,辐射源信号分选已经成为电子战中的重要环节,对电子战有着重要影响。当前雷达技术飞速发展,出现了许多新体制雷达,战场上的电磁环境日趋复杂,如何在复杂电磁环境中避免信号混叠、丢失,分选出准确的辐射源信号已经成为亟待解决的问题。本文首先介绍了本课题的研究背景和意义,
目的 通过对骨外黏液样软骨肉瘤(EMC)影像及病理特征进行探讨,以提高认知及诊断水平.方法 回顾性分析3例经手术病理确诊的EMC患者临床、影像及病理资料,并对相关文献进行复习.结果 3例EMC分别位于右大腿中下段、下腹壁及左大腿根部;病灶最大径2.3-10.5cm;2例边界清楚,病理示假包膜完整,1例边界不清,病理示侵及邻近腹膜.2例呈分叶状,密度/信号不均匀,增强扫描实性部分及分隔可见强化;其中1例CT平扫可见多发结节状高密度影,病理示钙化成分.另1例体积较小呈类圆形,密度尚均匀,增强扫描轻中度强化.结
目的 研究改良再定位咬合板治疗不可复性关节盘前移位(ADDWR)患者的临床作用.方法 回顾性2019年10月至2020年10月在本院门诊通过影像学检查确诊为ADDWR的22例患者的临床资料.按治疗方法的不同分为研究组与对照组,各11例.对照组单纯手法复位.研究组经手法复位后立即按再定位咬合板治疗.分别于复位前、复位后3个月、复位后6个月对患者疼痛情况、平均最大开口程度与颞下颌关节功能障碍指数进行比较.结果 治疗前,研究组与对照组者的疼痛评分无显著差异(P>0.05).治疗3个月后、治疗6个月后,研究组的评
目的 探讨超声引导竖脊肌平面阻滞对腹腔镜下胆囊切除术患者的镇痛效果.方法 选择2019年9月至2020年9月在本院实施腹腔镜下胆囊切除术的患者102例,按随机数字表法分为治疗组(n=51)和对照组(n=51).对照组行单纯静吸复合全身麻醉;治疗组行超声引导竖脊肌平面阻滞复合全身麻醉.比较两组镇痛情况、首次下床活动时间、首次排气时间、住院时间、不良反应.结果 治疗组的视觉模拟量表(VAS)评分均明显少于对照组(P<0.01);治疗组的首次下床活动时间、首次排气时间、住院时间均明显短于对照组(P<0.01);
[目的]通过对痰、瘀关系的深入探讨,促进相关治疗方案的优化.[方法]通过查阅痰、瘀关系病机理论的中医学文献,剖析痰、瘀病机的共性特征以及在致病先后、致病部位与相兼致病上的区别,并提出相应的优化治疗方案.[结果]痰、瘀致病具有共性特征,“痰瘀交阻”乃痰、瘀病证之后的“久久之病”的病机,痰性胶固、瘀兼痰之性,痰未必兼瘀、瘀必兼痰,痰瘀病位不同、痰在瘀先.痰瘀交阻治以化痰祛瘀,治瘀必兼化痰,治痰则未必兼用化瘀,治痰在治瘀之先.[结论]痰、瘀、痰瘀交阻是中医临床疑难杂证的重要病机,痰瘀并治、化痰祛瘀兼用具有盲目性