【摘 要】
:
随着人工智能学科的发展以及计算能力的提高,基于深度学习的人体行为识别研究已经成为热门的研究课题之一,同时也是非常有挑战性的研究难点。因为人体行为识别技术在人类社会
论文部分内容阅读
随着人工智能学科的发展以及计算能力的提高,基于深度学习的人体行为识别研究已经成为热门的研究课题之一,同时也是非常有挑战性的研究难点。因为人体行为识别技术在人类社会生活中有着广泛的应用,所以开展人体行为识别研究有着很高的实用价值。现有的行为识别方法通常只采用图像或是骨架等单一模态的数据。图像或视频包含直观的场景信息,但容易受到光照、遮挡等影响。骨架节点数据表示人体关节点在视频帧中的三维坐标,包含骨架的空间结构信息和时序的动态信息,同时骨架节点数据可以很好地避免遮挡,以及复杂背景等干扰,但是骨架数据缺乏外观的细节信息。因此,图像和骨骼数据存在高度的互补性,本文从骨架和图像两种模态的数据来进行多视角特征学习,结合两种模态数据的互补信息,提高行为识别的准确率。根据图像和骨架两种数据的特点,分别研究适合两者数据特点的深度神经网络模型。对于连续的视频帧数据,由于视频可以分解为图像数据和光流数据,采用双流的卷积神经网络架构来提取视频的时空信息,但是传统的双流网络很难有效的学习到视频中人体的长时程时空特征。针对双流卷积神经网络的不足,本文研究了卷积递归融合方法。该方法利用递归神经网络对长序列视频帧建模,提取视频帧长时间的依赖关系,同时将卷积操作和递归神经网络架构相结合,对双流网络输出的时空特征进行融合,充分利用了图像和光流的互补性来学习视频中的长期人体动作特征。此外,本文还研究了了RNN注意力机制,让网络学习在不同的时刻把注意力集中在与人体行为相关的区域。对于骨架数据,图卷积网络更适合这种非欧数据的建模。人体关节点之间相互连接成了一个不规则的无向图,图卷积网络能够提取和结合人体关键点序列空间局部特征的和时序特征。为了使算法在捕捉行为视频长期人体动作特征的同时也能够结合姿态关节点信息,提高算法的识别准确率,本文提出了一种对骨架和图像数据进行特征学习的高效的双流网络。由于对大规模神经网络进行端到端的训练存在参数巨大,难以训练收敛的问题,本文首先各自对卷积递归融合网络和图卷积网络进行训练,最后将两者的得分进行融合,以降低网络训练和调参的难度,从而实现对整体精度的提升。使用UCF101和HMDB51两个行为识别数据库对本文方法进行测试,与目前主流的视频行为识别进行了对比,验证了本文方法的有效性
其他文献
随着我国经济的不断增长,“三农”问题受到越来越多的关注,而农村的养老问题也已经成为我们要解决的重中之重。老年人为社会为家庭贡献了一辈子,能够实现老有所养,保障老年人
云杉矮槲寄生(Arceuthobium sichuanense)是中国特有的一种多年生寄生性种子植物,主要侵染青海云杉、青杆等云杉属树种,使寄主枝条产生扫帚状丛枝结构,影响树木生长,严重时使
离心泵偏离设计工况运行时,内部流动会趋于不稳定,导致效率下降,能耗上升,磨损加剧,严重时甚至会引发安全事故。因此,及时准确地诊断离心泵工况,很大程度上保障了离心泵运行
目的:探讨壮骨强筋片对前路颈椎次全切除及钛网植骨融合内固定(ACCF)术后植骨融合情况、脊髓功能恢复和疼痛缓解的影响。方法:根据纳入标准和排除标准,选取在2016年10月1日至2018年10月1日期间行颈前路椎体次全切联合钛网植骨融合内固定术(ACCF)的脊髓型颈椎病患者76例。按照随机数字法把76个病例分成实验组、对照组两组各38例,两组患者均行ACCF术、相同的术后处理和持续佩戴颈肩护具。实验
本研究旨在分析四川消费者对本地生产及进口服装的认知及购买意向的差异。本研究的目的是:建立四川省大学生在选择服装时考虑的认知;确定四川省大学生对进口服装的认知,并确
致病菌感染引起的多种疾病给人类健康带来了严重的威胁,抗生素是目前临床上治疗此类感染性疾病最简单、有效的手段。然而,由于抗生素长期的不规范使用和滥用等问题,导致了对多种抗生素具有耐药性的“超级细菌”不断出现并迅速蔓延。因此,拓宽思路,研发新型、广谱、强效且生物利用度高的纳米抗菌材料具有一定的现实意义。本论文主要探讨两类超小尺寸纳米颗粒(WO3-x,CN)的抗菌性能,并通过理论计算结合多种实验技术,深
随着铁路交通的快速发展,铁路系统的正常运行对铁路交通安全保障工作十分重要。在列车运行过程中,异物侵入铁路周界可能会引发严重的交通事故,继而造成人员伤亡和经济损失。
随着高等公路的迅猛发展以及汽车的普及,高速公路出行越加普遍。汽车高速行车工况下,车窗开启所产生的气动噪声严重影响舒适性;而车窗长时间关闭,二氧化碳浓度升高又容易产生疲劳诱发交通事故。因此,深入分析气动噪声意义重大。本文采用直接计算LBM-LES法,对某款实车全尺寸模型进行仿真分析,结合道路试验对包含风振噪声的较宽频段气动噪声进行研究。揭示风振噪声发声机理,分析风振噪声主要影响因素,归纳总结不同工况
随着大数据技术和人工智能技术的高速发展,网络结构作为一种常用的数据结构,用于描述现实世界中实体之间的复杂关系,在许多的领域中已经被大量的使用。常见的应用包括在网络
黑钨矿钨酸盐电极材料因稳定的物理和化学性能、环保、低成本以及良好的电化学性能等优点,成为超级电容器电极材料的研究热点。本论文采用共沉淀法制备了 Ni1-xCoxWO4(x=0、0.1、0.15和0.2)样品。由X-射线衍射(XRD)和场发射扫描电子显微镜(FESEM)知,Co掺杂对NiWO4的晶体结构和表面形貌影响不明显。X-射线光电子能谱(XPS)分析表明,Co离子是+2价的形式进入到NiWO4