基于Mask R-CNN的自然手势分割及其语义识别

来源 :内蒙古科技大学 | 被引量 : 2次 | 上传用户:saiuggidia
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手势作为一种人与人之间简便、直观的交互形式,随着人工智能和计算机视觉的迅速发展,对手势的识别也从过去的利用各种外界辅助设备到基于计算机视觉的研究阶段。而增强现实作为当前一种新兴的人机交互技术,将真实世界场景与计算机所生成的文字、图像、音频、视频等虚拟信息相结合,利用计算机生成的虚拟信息对真实世界进行补充,使虚拟信息与真实环境可以实时的显示在同一画面或空间,从而能够更加直观地观察分析现实场景中的数据信息和物理对象,是近年来国内外众多学者的研究热点之一。将自然手势用于增强现实系统,通过自然手势与虚拟物体之间的交互,力求解决增强现实在场景中虚实交互的一些主要问题,使其能够营造更加具有沉浸感的交互体验。为了实现对自然手势精细的分割与精准的语义识别,综合考虑现有手势识别算法存在的识别率较低、鲁棒性差、分割准确性不佳等缺点与不足,本文提出了一种基于Mask R-CNN的手势分割与识别方法。该方法通过使用基于多尺度特征融合的特征金字塔网络、优化候选窗口分类器、引入基于评分策略的像素级分割掩码,实现自然手势的精准分割与识别。首先,对Mask R-CNN主干网络中的特征金字塔网络进行多尺度特征融合,使其具有自下而上的反向连接与横向连接和多尺度特征图融合两部分;其次,对窗口分类器在特征提取网络与RoIAlign结构增加Dropout层进行优化,防止训练过程中产生过拟合;最后,引入掩码评分策略MaskIoU Head,对掩码分支进行相应改进,实现掩码的精准分割。通过对增强现实技术的整体流程的分析研究,以图像分割和手势识别为核心,对Mask R-CNN算法进行改进,通过将基于多尺度融合的特征金字塔作为特征提取网络的扩展,对候选窗口分类器改进以防止训练过拟合,将像素级分割掩码结构进行优化修化。实验结果显示,基于Mask R-CNN的改进算法能够有效避免训练过程中产生的过拟合问题,且与传统算法相比,该算法具有更高的手势识别率、更佳的分割精度和鲁棒性。通过获取手势的深度信息与分割结果,对手势位置进行检测,从而实现简单的虚实交互。
其他文献
随着5G与物联网等信息技术的发展,越来越多的网络设备节点加入到通信网络中,而设备到设备(Device-to-Device,D2D)通信技术成为网络中节点通信的重要手段。在D2D通信网络中,设
滤波-正交频分复用技术(Filtered-Orthogonal Frequency Division Multiplexing,F-OFDM)作为未来高度异构通信网络的有效技术方案,将系统带宽根据业务场景划分成多个非均等的
目的:研究DEHP对MCF-7细胞中3β-HSD表达的影响,构建3β-HSD基因沉默和高表达细胞株,探索3β-HSD在DEHP生殖内分泌毒性中的作用,为进一步了解DEHP的毒性作用机制奠定基础。方
我国物之瑕疵担保责任在合同法立法上与司法实践上均存在问题。合同法立法上,未直接规定物之瑕疵担保责任的风险转移问题;物之瑕疵认定标准混乱,缺乏可操作性;物之瑕疵担保责
二十一世纪是信息化时代,计算机网络的应用遍布各个领域,随着计算机通讯网络技术的发展,离散时间排队系统也得到了深入的研究.在离散时间排队系统中,时间轴被分割成等长的间
随着深度学习技术的发展,研究者们利用神经网络对文本进行情感分析,取得了非常好的结果。但随后研究陷入了瓶颈,以往的技术无法处理蕴含复杂情感的文本,尤其当文本中包含几种
QCD预言退禁闭相变在高温或高密情况下发生。中子星内部为机高密环境,可能有夸克物质存在。这给传统中子星模型及相关天体物理带来挑战,脉冲星的中心天体本质需要深入探讨。
随着国际投资活动的频繁推进,投资相关争议也越来越尖锐,其中公平公正待遇条款因为语义抽象,所以在适用中存在诸多分歧,也因此越来越受到学界的关注。对中国既已签署的148个
地理位置是人类行为活动的重要基础之一,而室内又是人类每天活动时间最长的场所。因此,将室内位置与用户数据或用户感兴趣的信息结合起来是值得深入研究的一个重要课题。室内
近年来无线通信技术发展迅速,已经渗透入日常生活的方方面面。在未来万物互联时代,海量的无线通信设备(如无线传感器、可穿戴设备、智能手机等)同时工作在网络的边缘,其普遍