基于RGB-D视频的多模态手势识别 - 论文文献免费下载 - 搜论网

基于RGB-D视频的多模态手势识别

来源 :计算机系统应用 | 被引量 : 8次 | 上传用户：juannayuan

【摘要】

：

本文是对SKIG RGB-D多模态的孤立手势视频进行手势识别研究.首先将RGB和Depth两种单模态视频提取成图片的形式保存,然后采样成长度为32帧的手势序列分别输入到本文提出的稠密连接的3DCNN组件学习短期的时空域特征,然后将提取的时空域特征输入到卷积GRU网络进行长期的时空域特征学习,最终对单模态训练好的网络进行多模态融合,提升网络识别准确率.本文在SKIG数据集上取得了99.07%的识别准

【作者】

：

马正文蔡坚勇刘磊欧阳乐峰李楠

【机构】

：

福建师范大学光电与信息工程学院,福建师范大学医学光电科学与技术教育部重点实验室,福建师范大学福建省光子技术重点实验室,福建师范大学福建省光电传感应用工程技术研究中心,福建师范大学智能光电系统工程研究中

【出处】

：

计算机系统应用

【发表日期】

：

2018年12期

【关键词】

：

手势识别稠密连接的3DCNN 卷积GRU 时空域特征 gesture recognition densely connected 3DCNN convolut

【基金项目】

：

福建省自然科学基金(2017J01744).

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文是对SKIG RGB-D多模态的孤立手势视频进行手势识别研究.首先将RGB和Depth两种单模态视频提取成图片的形式保存,然后采样成长度为32帧的手势序列分别输入到本文提出的稠密连接的3DCNN组件学习短期的时空域特征,然后将提取的时空域特征输入到卷积GRU网络进行长期的时空域特征学习,最终对单模态训练好的网络进行多模态融合,提升网络识别准确率.本文在SKIG数据集上取得了99.07%的识别准确率,达到了极高的准确率,证明了本文提出的网络模型的有效性.

其他文献

带相关反馈的基于深度神经网络模型的人脸检索方法

针对大规模人脸检索问题,提出了一种带相关反馈的基于深度神经网络模型的人脸检索方法.首先利用卷积神经网络对人脸进行特征提取,再利用传统的检索方法进行人脸检索,在检索环

期刊

人脸检索卷积神经网络哈希检索相关反馈face retrieval CNN hash retrieval relevance feedback

基于SVD的人脸对称性的两步人脸识别算法

为了缓解人脸图像容易受光照、表情和姿态变化对人脸识别的影响,Yong提出了利用了人脸的对称性产生新的样本来表示人脸特征的方法.这种方法可以反映出人脸样本由于表情、姿态

期刊

人脸识别奇异值分解图像镜像对称图像face recognition SVD mirror image symmetrical image

其他学术论文