【摘 要】
:
人体步态作为一种生物身份识别特征,相比于人脸、指纹、声纹等,由于其具有不宜伪装,可接受性高,可以远距离获取等优点,因此在智能安防、刑事侦查等领域具有重要的潜在应用价值。然而,由于实际拍摄环境的复杂性,人体步态识别也面临着诸如拍摄角度,行走速度、携带物等多方面的挑战。在这其中,视频拍摄角度的不同会带来人体步态行走轮廓的明显变化,造成步态识别准确率的剧烈下降,严重阻碍了这项技术走向大规模工程应用。面对
论文部分内容阅读
人体步态作为一种生物身份识别特征,相比于人脸、指纹、声纹等,由于其具有不宜伪装,可接受性高,可以远距离获取等优点,因此在智能安防、刑事侦查等领域具有重要的潜在应用价值。然而,由于实际拍摄环境的复杂性,人体步态识别也面临着诸如拍摄角度,行走速度、携带物等多方面的挑战。在这其中,视频拍摄角度的不同会带来人体步态行走轮廓的明显变化,造成步态识别准确率的剧烈下降,严重阻碍了这项技术走向大规模工程应用。面对此问题,本论文在对国内外步态识别研究现状,尤其是跨视角问题研究现状以及相关基础技术进行充分调研的基础上,基于深度学习方法,对跨视角情况下的步态识别相关技术进行了研究,目的在于提升跨视角场景下步态识别的准确率。本文的主要研究工作归纳如下:(1)基于生成对抗网络的人体步态图像视角转化方法研究。针对步态图像视角不一致的问题,本文基于生成对抗网络,提出了身份保持多目标视角步态图像转化模型,将输入的不同视角下的步态图像,转化至多个统一的目标视角,并利用这些统一目标视角下的步态图像确定其所对应的身份,以此来消除视角差异的影响。在进行视角转化的过程中,加入了身份判别器,从而使得在转化过程中步态图像的身份信息得以保留。与此同时,利用循环生成的方式,提升了图像生成器的生成能力。通过在不同的步态数据库上进行实验验证,证明了本视角转化算法的有效性;(2)基于注意力机制的跨视角步态识别方法研究。在本研究点中,基于注意力机制,本文设计了步态身份识别方法,直接从不同视角的输入步态图像中提取出与视角无关的身份特征并进行识别。本方法首先利用卷积神经网络对输入步态图像进行初步的特征提取,随后,为了充分利用不同精细度下的步态特征,对经过特征提取后的特征张量进行多尺度特征分块;与此同时,为了加强特征块中与身份相关的部分,弱化无关冗余信息,将分块后不同精细度下对应的特征块分别输入相应的混合域注意力机制模块中,生成通道域注意力权重和空间域注意力权重,并根据权重值对特征块进一步处理,最终得出具有身份鉴别力的步态特征。最后,通过实验验证,证明了本方法在解决步态识别跨视角问题上具有一定的优越性。
其他文献
在实际应用中,因为测试任务的复杂,测试领域对多功能模块化仪器的需求越来越大。目前国外对多功能模块化仪器的研究较为成熟,仪器功能丰富但价格昂贵,国内并未推出多功能模块化仪器。为打破进口垄断,实现国产化,在国内开展对多功能模块化仪器及其配套软件的研究十分必要。本文的研究目标是基于某型VXI总线多功能模拟信号测试模块进行软件设计。该模块集成了数字化仪、任意波发生器和频率计的测量功能,可应用于多功能联合测
当前主流的人体安检设备大多为金属探测门,但其仅能对人身携带的金属物品进行检测,而对其他非金属材质的物品检测能力不足。太赫兹无源成像技术采用无源的工作方式,被动地接收人体和隐蔽目标自身辐射的太赫兹频段电磁波来进行成像,对人体无辐射性危害。并且太赫兹频段电磁波对衣物等具有高穿透性,可以探检到隐藏在人体衣物内的各类危险物品,该技术在公共场所的人体安检设备中具有重要的应用前景和研究价值。本论文的研究依托于
随着人口老龄化的加剧,人们对老年人的健康监测技术提出了更高的要求。室内人体速度估计是老年人居家健康监测的关键,它可以提供人体的运动状态。现阶段,一些穿戴式设备或光学设备等都提供了高准确度的速度估计方法,但接触式设备的要求是繁琐的,而光学设备也存在只能视距监测、侵犯隐私等问题。因此,人们迫切需要一种非接触性和非视距性的速度监测方法。随着技术的发展,基于射频信号的无线感知技术得到了广泛关注。但是,由于
目前,随着互联网技术的快速发展及工业4.0的提出,未来的社会生活将会发生巨大的变化。目前5G技术的发展以及6G技术的提出让万物互联不仅仅只是期望而有望成为事实,而要实现万物互联,其中的一个关键技术突破点就在于人机交互新型传感器的开发。例如智能家居系统中如何感知人体的温度及人体的位置从而实现家居系统的智能调控,无人看护的老人如何感知判断自身的身体状况指标并上传到监控系统,仿生型机器人如何具有类似于人
图像语义分割旨在实现图像像素级区域分割与识别,是多媒体分析、计算机视觉等众多任务的基础步骤。由于存在类内的差异性、类间的相似性、以及背景的复杂性等干扰问题,图像语义分割是一个极具挑战的工作。传统分割方法立足于手工设计的低层特征,难以有效刻画对象的语义信息,导致分割性能不足。近期,基于深度学习的分割方法能够通过深度网络提取更具判别性的深度语义特征,有效改善了语义分割性能。然而,基于深度学习的图像分割
人体行为识别是机器人系统及计算机视觉领域的基本研究挑战之一,其研究内容是识别视频中的人体行为,对视频进行分类。基于视觉的人体行为识别技术有着重要的现实意义,在智能监控,自动驾驶,视频剪辑,基于互联网视频的内容检索与分类,以及人机交互,游戏娱乐等领域有着重要的应用价值。传统算法往往识别精度较低,实现复杂,且大多依赖手工特征,模型的普适性较差;深度学习的出现与普及在很大程度上解决了传统算法中存在的一系
金属3D打印应用广泛,在现代制造技术中具有举足轻重的地位。在使用SLM技术打印过程中,零件内部会形成较大的温度梯度,同时受到周围材料的约束在金属结构件中产生较大的热应力,如果当残余应力积累到材料强度无法抵抗时会产生裂纹来释放应力。裂纹缺陷严重影响到零件的力学性能、减少零件的疲劳寿命,因此实现裂纹缺陷的检测定位是具有重要意义的。声发射技术作为一种新型的动态无损检测技术,越来越多的被应用于复杂的工业检
随着电力电子、机电一体化等领域的快速发展,电子测试技术已经越来越广泛地应用于各类工业生产和科研工作中。但是传统的测量仪器面对现代社会越来越高的测量需求,已经难以应对。因此开发出一款能够实现多通道、多物理量测量并且具有程控功能的示波记录仪尤为重要。本文研制的示波记录仪是一款基于采集板卡+信号处理板+工控机架构的多功能电子测量仪器,本文的研究目标是为其设计实现底层软件及程控功能,底层软件包括可供应用层
图像分割是计算机视觉与图像处理应用的关键基础,其研究目标是根据图像内在特征建立像素级标签,将其划分为不同的语义区域。随着深度学习技术的兴起,基于卷积神经网络的图像分割技术取得了阶段性突破。然而,现有方法主要基于图像局部特征到像素级标签的非线性映射,其成功依赖于成像清晰、规模庞大的高质量训练数据集,在众多实际应用中均难以获取。一方面,恶劣天气(如雨、雾)环境下采集的图像数据规模大,但能见度低,为精准
随着企业的发展,部门间的沟通与交流已占据了企业日常工作的大部分,普通电话、邮件、即时聊天、会议等形式的问题处理已不能满足企业日常工作中问题的及时性与有效性,目前工作上的问题已经制约着工厂的生产效率,各部门每天不得不花费大量的时间进行推诿扯皮。为了解决以上问题,建立一套专门用于问题处理与跟踪的系统尤为重要,于是开发了复材厂问题协调管理平台,该平台基于.NET框架,使用C#语言,选择使用Oracle数