基于深度学习的动态手势识别研究

来源 :武汉科技大学 | 被引量 : 0次 | 上传用户:shmilyuho
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着深度学习技术的发展,基于计算机视觉的动态手势识别也有了一些突破性的进展。目前,主流的动态手势识别方法主要通过视觉来完成,通过对手势视频卷积运算实现时空特征提取,但是相较于单幅图像卷积计算,动态手势的多帧图像卷积运算数据量更庞大,提取特征更复杂,网络参数更多,进而影响到模型的识别效率和实时性。因此,开展基于深度学习的动态手势识别具有重要研究意义。针对上述问题,基于3D卷积神经网络,结合注意力机制和视频关键帧提取算法,开展双模态信息融合的动态手势识别方法研究。主要研究内容如下:(1)基于Kinect的动态手势数据库的建立。通过Kinect的相关内置参数矩阵,统一深度相机和彩色相机的空间坐标系,保证相机采集的彩色与深度图像坐标一致。利用Kinect获得动态手势的彩色和深度图像,构建动态手势数据库。(2)基于深度学习的视频手势定位。针对视频中动作手势起止帧难以确定的问题,通过改进Faster-RCNN的锚框生成方法和ROI池化方法,实现视频手势动作的时间区间的分类和回归,实现对视频序列中动态手势时间区间的定位检测。(3)基于三维卷积神经网络的动态手势识别。基于CBAM-C3D构建了动态手势识别模型,实现动作手势的识别任务。同时使用关键帧提取技术、多模态联合训练和BN层优化等系列操作来提高网络的性能。本文所提出的结合注意力机制的3D卷积神经网络在自建手势数据集上达到86.41%的识别准确率,相对于目前主流的动作分类方法有明显提高,验证本文算法的有效性。
其他文献
多维力传感器因其具有诸多的优势而被广泛应用于机器人、车辆、医疗和航空航天等领域。目前关于多维力传感器的研究大多局限于静态测量,在进行动态测量时通常是将静态测量的结果用于动态测量系统中,会影响整个动态测量系统的精度,因此针对多维力传感器的动态测量方法进行研究是十分有必要的。本文基于偏最小二乘法(Partial Least Squares,PLS)的计算原理,通过理论计算、仿真和实验的手段,研究了多维
学位
合金化热镀锌生产过程中存在保温段温度降低和冷却段冷却效率不足的问题。保温段温度的降低会使镀层的形成速度减慢、镀层内化学成分不均匀,影响到镀层的性能和生产效率;冷却段冷却效率的不足会使出口带钢温度升高,出口带钢温度过高时,合金化镀层将脱落在炉顶辊上,造成合金化镀层表面质量缺陷及折皱,粘连的锌渣从炉顶辊坠落将引发安全隐患。本文将对合金化炉内流动与传热的机理进行研究,构建阶梯式喷射冷却模型,实现增强保温
自动定位消防水炮系统能够在火灾发生的早期自动跟踪定位火灾部位,并自动喷水灭火,是一种应对大空间场所火灾的有效措施。但在室外大规模火灾现场中,环境变化以及水炮自身压强变化等不确定因素会导致水炮打击火点目标的准确度下降。因此,捕捉并提取水炮射流轨迹从而形成有效的闭环控制具有较强的现实意义和应用价值。本文提出一种水炮射流轨迹图像分割方法。由于在自然场景下光照不确定、背景复杂等特点,使得传统的图像分割算法
我国是能源的消耗大国,余热资源利用效率与发达国家相比较低,有大量的余热资源被浪费。余热资源由于其间歇性和分散性的特点,其回收利用难度较大。相变储能技术因其特殊的优势,可以有效的解决余热资源在空间上和时间上不匹配的问题。相变储热技术在余热回收利用领域具有十分广阔的发展前景。本文设计使用不锈钢制作相变储热换热装置,首先研究了拟使用的几种相变材料包括单一脂肪酸、脂肪酸与石蜡混合相变材料及添加石墨制备的复
RNA在生物细胞中有着重要的作用,RNA结构对其功能有着重大影响。其中,RNA的二级结构是承载一级结构和三级结构的中央枢纽,预测RNA二级结构是理解RNA生化功能的重要途经。含假结的RNA二级结构是一种复杂的二级结构,生物细胞中许多重要的生命活动都有它的参与,其预测难度更大,已经被证明是一个NP完全问题,吸引了诸多研究学者关注。因此,设计一个合理高效的算法预测含假结的RNA二级结构具有深远意义。为
微型机器人是近年来研究的热点,在群体机器人,环境勘探,搜寻搜救等领域应用广泛。避障是微型机器人自治控制的重要能力,目前的避障主要依赖红外线,超声波和雷达,然而这些系统对于环境条件要求苛刻,所以极大地限制了微型机器人的自主性能。针对上述局限性,本文将视觉传感器应用于微型移动机器人以提升避障自主性。另外,视觉传感器软硬件结构复杂,耗费的经济成本和时间成本高,而微型机器人结构简单、计算资源有限,为了解决
光学相干断层扫描成像可以获取视网膜的高分辨率横截面组织图像,并用于评估视网膜层厚度的变化。近些年基于深度学习的自动视网膜层分割算法被提出用于辅助临床诊断,然而大多数的分割方法不能很好地处理受严重病变影响的视网膜组织。另外,无论是基于传统机器学习还是基于深度学习的层分割算法,都需要大量的标注图像作为学习样本,而视网膜OCT图像的手动标注需要花费大量时间,这对层分割算法的构建提出了巨大的挑战。本文针对
随着高温工业的不断发展,对绿色轻质隔热保温材料的需求也逐渐增加。具有丰富孔结构的多孔氧化物陶瓷在高温隔热领域得到了广泛的应用。但是,传统的氧化物多孔陶瓷存在着热震稳定性较差,易发生晶型转变和颗粒再烧结等问题,使用温度范围较窄。而氮化物具有熔点高、硬度大、热稳定性好及耐磨性好等优点,在高温、高压以及强腐蚀等苛刻条件下使用具有显著的优势。氮化钛除了具有上述优点之外,还具有良好的导电性和生物相容性。因而
我国是地震多发国家,地震给人们生命财产带来了严重的威胁。随着抗震设防要求的提高,在原来“小震不坏”、“中震可修”、“大震不倒”的基础上,我国提出了“韧性城市”的建设计划,要求如医院、学校、应急指挥中心等生命线工程可以在震后保持功能正常,一般建筑也要求在震后实现功能的快速恢复。传统的抗震加固方法由于施工周期长、环境污染大、对结构抗震性能的提升有限等原因已经不能满足当前更高的抗震需求。因此开发一种新的