手势检测及识别在人机交互中的应用

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:jsq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
经过几次计算机革命之后,如今智能生活无处不在,人机交互成为人类世界中不可或缺的角色。随着可穿戴设备受到越来越多人的广泛关注,人机交互走入人们的日常生活。而人类发展的历史长河中肢体语言是最初始最自然的交互方式,所以第一视角下的手势检测及识别在人机交互中具有非常大的研究意义与研究价值,使得计算机和人的“沟通”更加便捷。最近几年来卷积神经网络(Convolutional Neural Networks,CNNs)在不同的领域都表现得非常出色,与传统的方法相比能够解决较为复杂的模式识别问题。卷积神经网络通过对大量的已标注的数据进行学习从而提取图像的特征信息。在图像处理领域,如自然场景的文字识别检测,自动驾驶中障碍物和警示牌的检测,人眼定位等都取得了非常好的成绩。本文研究基于深度卷积神经网络算法对第一视角的多种手势进行检测、识别以及指尖定位。主要研究不同的动态或静态手势在人机交互中的应用,设计第一视角手势交互应用系统。目前第一视角的手势数据量较少,背景也相对单一,手势检测、识别以及指尖定位的算法都不能够满足应用要求,故本文在数据构建、算法优化、应用实现等方面进行研究,主要工作如下:1.研究分析不同国家的文化,定义相对直观、易于理解的数字手势,基于第一视角的不同场景不同光照情况下采集RGB手势视频,并标注手势的外接矩形框,从而构建可用性高的两个数据集(EgoFinger and EgoGesture);2.手势在人机交互中的应用称为手势交互系统,本文将手势交互分为手势检测、手势识别、指尖定位,融合手势检测和手势识别模块作为算法的第一个级联网络,提出基于卷积神经网络算法实时且准确的检测手势在图像中的位置,及识别手势的种类;3.本文提出基于全卷积神经网络以热图的方法估计不同手势指尖点的位置,有效去除复杂背景的干扰,降低指尖估计的难度,在准确性和实时性上都有非常大的突破;4.本文基于第一个级联网络和第二个级联网络研究动态手势在人机交互中的应用,结合Qt开发框架完成空中鼠标及空中手写交互系统搭建。
其他文献
知识就是力量。知识对于人类的生活至关重要,同时知识也是人工智能的基石。形成知识的过程本质就是在建立认知乃至理解世界。因为人类有获取、形成以及升华知识的能力,所以人
分析了中国煤炭运销管理存在的问题,结合煤炭运销管理的特点,对运销决策的功能需求进行了分析,并在此基础上构建了基于数据仓库的煤炭运销决策支持系统模型。
文本作为社会信息交流的基本工具,其识别任务一直以来作为学术界的研究难点和热点。本文主要对于手写文本以及自然场景文本的识别任务展开研究,二者都存在着相应的难点需要进
认知语言学的发展使图式理论成为二语习得研究中的热点,其应用呈跨领域和学科交叉的特点。分析总结近年来图式理论应用于词汇习得、翻译及语言文化各个方面的研究特点,描述、归
文化教育是实现运用语言进行交际的关键,发展交际能力是英语教学的最终目的.所以,在英语教学中,让学生掌握语言技能的同时,提高语用能力,实现跨文化交际,是每位英语教师肩负
孔子,以孔为氏,名丘,字仲尼。“子”,古代对成年男子的尊称,在春秋战国时期,拥有一定社会地位的成年男子都可以称为“子”,而且都希望别人称自己为“子”,因为“子”还是一种爵位,但是
颠覆性技术具有超越性和突变性的形态,能催生新的产业,深刻影响经济社会发展格局。美国设立国防部高级研究计划局促进军工产业颠覆性技术创新,产生了较好的成效。本文从组织