基于三维深度神经网络的动态手势识别的方法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:lin820306
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的高速发展,越来越多的技术被运用到人们的日常生活中来,因此,通过科技使人们过上更加舒适简洁的生活也成为了当今学术界和工业界的一致目标。而近来人工智能的兴起更是掀起了智能化生活的热潮,其中,人机交互作为人与机器的交流方式,在智能化生活中更是必不可少。而手势识别作为一种简单自然的交互方式,更是备受瞩目,人们期望通过手势识别使得人机交互变得方便自然,更加贴近人类的生活习惯。因此,为了促进动态手势识别准确率的提升,本文主要做了如下工作:(1)针对动态手势识别中,需要尽量保留手势视频中含有运动信息的帧图像的问题,提出一种“关键帧”提取方法。首先,对手势视频做统一帧数处理,在对数据集进行统计分析的基础上,确定网络输入视频的基准帧数。其次,在视频采样的过程中,为了尽量保留富含运动信息的“关键帧”,根据光流值可以代表运动剧烈程度的原理,使用一种基于光流的加权平均采样方法,根据原始视频中各段的平均光流值来对视频按比例进行采样。最终获得了帧数统一且含有丰富运动信息的手势数据集。(2)针对动态手势具有时序特征以及深层网络遇到的退化问题,使用一种由残差思想改进的三维卷积神经网络进行手势的特征提取。在动态手势识别中,需要用三维卷积神经网络来同时提取手势的时序和空域特征。在此基础上,为了更深层次地学习手势的抽象特征,本文使用一个将残差思想与三维卷积神经网络结合起来的ResC3D网络来分别对RGB、深度、光流数据进行特征提取。(3)针对单种数据无法表达手势所有信息的问题,提出一种基于CCA典型相关性分析的特征融合策略。在手势识别中,为了获得手势的更多信息,需要对多种数据进行融合。本文首先分析了视频、特征、决策这三种级别的融合策略,根据实际情况确定了进行特征级别的融合。其次,对于特征融合,本文又分析了均值融合和级联融合的优缺点,根据对识别效果和训练时间的衡量,使用了一种CCA典型相关性分析融合方法,其根据各种模态特征之间的相关性,将RGB、深度、光流这三种特征融合到一起,得到一个含有丰富信息的综合特征,为后续的分类识别奠定了基础。为了验证本文算法的有效性,本文使用ChaLearn大规模独立手势识别大赛的官方数据集——IsoGD数据集进行了实验与测试。首先针对上述创新点进行了单独的对比实验,并分别对其进行分析,证明了上述改进的有效性与必要性。随后,将本文算法的最终结果与其他使用同样数据集的优秀算法进行对比,证明了本文算法的优越性。
其他文献
齿轮箱是机械设备中关键的传动部件之一,它的健康状态、工作寿命在整个装备运行中举足轻重。齿轮箱中的关键零部件为滚动轴承和齿轮,本文针对齿轮箱中滚动轴承与齿轮复合故障难以诊断的问题,研究了信号的固有时间尺度分解(Intrinsic Time-scale Decomposition,ITD)算法,最小熵解卷积(Minimum Entropy Deconvolution,MED)算法,以及快速独立分量分析
Petri网作为一种建模工具,是对离散事件系统进行建模和分析的主要工具之一。典型的离散事件系统如柔性制造系统、半导体生产线等。在柔性制造系统中,由于资源分配的不合理会
图像作为日常生活中传递信息的重要载体,相比于信息的其它传递形式,通常能够携带更多的信息。但是,图像在采集、处理、传输过程中都会不可避免的受到各种类型失真的影响,从而
立体视觉是从多幅图像中恢复场景三维信息的方法,双目立体视觉技术模仿人类视觉系统,从双目图像感知空间的三维信息。通过双目立体视觉技术提取场景深度和三维信息是立体视觉
伴随着计算机技术与科技的迅猛发展,信息的获取日趋多样化,人类生活的自主性与独立性不断提升。逐渐普及的视频个性化服务以及互联网的广泛应用为人们的日常生活带来了巨大的
在分布式人工智能领域中,单个智能体已经无法解决日益复杂的问题,需要多个智能体协同处理,因而多智能体协同工作成为该领域的一个研究热点,其中一个关键问题在于如何建立一个
Petri网作为一种将图形描述与数学分析相结合的工具,特别适合对离散事件系统进行建模、分析和控制。Petri网用于制造系统建模的一个优势就是它可以简单准确地对系统中的并发
Inconel 718是一种强、塑性配合良好且蠕变持久性能优异的形变高温合金,被广泛应用于航空航天、船舶、能源等领域中的零配件制造。如今为满足日益苛刻的使用环境,除了采用合
近年来,无线网络相关技术获得迅猛发展,但随之而来的异构无线网络共存问题也是长时间的悬而未决。在无线传感器网络中,基于IEEE 802.15.4的ZigBee技术由于其低成本、低功耗,
鲁棒性的视觉单目标跟踪算法研究是目前计算视觉领域的研究热点。近些年来,该领域的研究取得了一定的发展,所提出的目标跟踪算法在跟踪鲁棒性和跟踪速度上取得了良好的效果。