【摘 要】
:
基于视觉的动态手势跟踪与识别一直都是计算机视觉领域的研究研究重点与难点,其涉及多个视觉领域相关技术,是多个视觉方向的交叉课题。其中最为关键的动态手势跟踪技术和建模识别技术仍然不够成熟与完善。目前动态手势跟踪技术正处于从传统跟踪方式过渡到深度学习跟踪框架的阶段,现有的深度学习跟踪框架不能很好地适用于手势这种高自由度、空间占比小的视觉目标跟踪。另一方面,由于动态手势灵活多变、运动过程复杂,很难建立有效
论文部分内容阅读
基于视觉的动态手势跟踪与识别一直都是计算机视觉领域的研究研究重点与难点,其涉及多个视觉领域相关技术,是多个视觉方向的交叉课题。其中最为关键的动态手势跟踪技术和建模识别技术仍然不够成熟与完善。目前动态手势跟踪技术正处于从传统跟踪方式过渡到深度学习跟踪框架的阶段,现有的深度学习跟踪框架不能很好地适用于手势这种高自由度、空间占比小的视觉目标跟踪。另一方面,由于动态手势灵活多变、运动过程复杂,很难建立有效的通用手势模型进行识别。因此,本文对基于深度学习手势跟踪框架和动态手势建模识别两方面展开研究。首先,针对传统的手势跟踪方式在复杂环境下目标跟踪精度不高的问题,引入多域卷积神经网络建立动态手势跟踪框架,分析网络优缺点。根据跟踪网络获取的手势区域中心坐标对轨迹式动态手势建立手势轨迹模型并利用深度学习网络实现动态手势识别,验证深度学习跟踪框架在动态手势识别中的可行性。其次,针对多域卷积神经网络计算量大、实时性差的问题,提出一种基于注意力机制改进的实时多域卷积神经网络跟踪的动态手势识别框架。引入实时多域卷积神经网络实现手势实时跟踪处理,并在此基础上加入注意力模块来校准特征的空间重要性,明确跟踪目标的判别区域,大大提升手势跟踪的精度。在此基础上全面考虑手势的特点,综合利用手势的运动信息、外观信息和时间信息建立手势帧差时空图模型并利用深度学习网络对动态手势进行识别,在国际公开的CGD手势库上取得良好的识别结果,为复杂场景下动态手势跟踪与识别提供了可行的解决方案。
其他文献
产业兴旺则乡村振兴,乡村产业关乎农村社会民生福祉。从脱贫攻坚到乡村振兴,国家动员大量人力、财力和物力资源投入乡村产业建设中,农村不仅迎来新的发展机遇也面临着转型的挑战。本文选取的田野地穆村作为中部地区乡村工业的典型代表,有着百年皮毛加工史,改革开放之后的几十年内发展成为亚洲最大的羊皮、羊剪绒加工地和集散地。尽管也有个别成规模的现代工厂,但数量繁多、分工合作的家庭作坊和家庭工厂却是产业组织的主要形式
高熵合金作为近年来研究者关注的新型合金体系,在目前的研究中,其多组元、高混合熵的特点使其在机械性能、耐蚀性能、铁磁性等方面均有较为优异的表现。但是对于其主流的研究上依然以块体结构材料的方式进行制备与应用,在增材制造技术飞速发展的当下,涂层这种形式的制备工艺与新材料的开发依然具有极大的潜力。在本次工作中,选取了 FeCoCrNi高熵合金体系作为基础,通过向其中分别添加 Cu、Si 两种元素,制备了
眼部碱性化学烧伤(Alkali Burn)是眼科急症之一。由于碱性化学物质能溶解脂肪和蛋白质,碱液易于透过角膜向眼内渗透,受损的组织进一步分泌蛋白酶加剧组织细胞的溶解、坏死,反复且难以控制的炎症以及组织粘连、新生血管生长,最终发展为眼部畸形/致盲。尽管临床上采用多种治疗方法,包括:立即灌洗,去除有害物质;药物治疗;早期促进上皮形成、控制炎症蔓延,后期减少瘢痕形成;手术治疗等。但对中重度的角膜碱烧伤
随着航空工业的发展,对小重量、高机动、多功能和高可靠性的飞机设计要求越来越高。飞机在飞行过程中,振动在是无法避免的,机载产品要经受严苛的随机振动考验,振动载荷引起机载产品发生失效的问题日益增加,影响飞机的正常飞行。本文以某型飞机监控系统盒为研究对象,按照国军标的耐振强度试验要求,进行随机振动试验,同时,利用有限元软件,对监控系统盒进行力学性能分析,通过对比来验证分析结果的合理性。首先对随机振动基本
本文基于常规杠杆型非线性能量阱,应用并联与串联非线性能量阱的方法提出两种增强型杠杆非线性能量阱:杠杆型并联非线性能量阱和杠杆型串联非线性能量阱。首先,研究了附加了杠杆型并联非线性能量阱的整星系统的振动抑制,应用谐波平衡法和伪弧长延伸法得到系统的幅频响应曲线。分析了杠杆型并联非线性能量阱的质量,非线性刚度以及悬挂位置参数对系统幅频响应的影响。对比研究了在孤立环状共振响应消失后,杠杆型并联非线性能量阱
铝-铜复合结构满足高新科技领域对成本低、质量轻、综合性能优异构件的要求。然而熔点相差较大及硬脆Al-Cu相的产生导致难易获得高质量的铝-铜接头,制约铝-铜复合结构在航空航天领域的应用。搅拌摩擦点焊(Friction stir spot welding,FSSW)在铝-铜异材的连接方面具有较强的技术优势。Zn对抑制硬脆Al-Cu相的生成有积极作用。本文提出了添加Zn夹层的FSSW技术,通过Zn夹层的
声学超表面是科研人员在超材料亚波长结构的基础上,结合相控阵波场控制原理提出的新兴概念。将亚波长尺度的功能单元按照特定的方式周期排布,通过改变结构表面相位梯度的方式,使超表面获得传统人工周期材料所不具备的超常声学、力学性能,为声波和弹性波的调控提供了新的技术途径。作为一种新型人工结构,声学超表面具有尺寸小、损耗低、调控自由度大、易于加工装配等特点,因而在机械工程减振降噪、交通运输以及人类生活领域具有
由于人与计算机对图像相似性判别依据之间的不同,造成了人所理解的“语义相似”与计算机理解的“视觉相似”之间的“语义鸿沟”,那么如何让计算机从人脸图像中自动提取出与人所理解的相似语义成为了人脸检索、识别、验证等领域的难题及关注的焦点。本文基于公理模糊理论(Axiomatic Fuzzy Set,简称AFS)研究了人脸语义自动提取技术。首先,应用人脸关键点检测器检测人脸面部关键点,并基于人脸关键点定义人
近年来在农村经济不断发展的前提下,国家要求进一步推进美丽新农村建设,切实改善农民生产、生活质量与农村基本面貌,提倡以沼气利用为核心的循环系统入户。合理利用清洁能源,对保护生态环境,提高经济发展有重要作用。但由于目前沼气系统中沼气、沼液、沼渣的净化与处理不当导致大量资源浪费与环境污染问题,严重阻碍我国农村生态文明建设进程,同时也为我国发展清洁能源带来了新的挑战。本课题将针对能源利用不当等问题进行详细