行人轨迹预测及多相机下行人追踪技术的研究与实现

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:zhym821211
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年,在公共场合的视频监控设备数量飞速增长,例如机场、地铁和商场等。然而,仅依靠人类的视觉来查阅海量的视频数据有很大的困难。采用一些智能的方法让计算机来处理、分析,以挖掘视频中的信息具有很大的学术和商业价值。在本课题中,我们聚焦于计算机视觉中的行人轨迹预测和多相机下行人跟踪问题,展开相关的研究与技术实现。多相机多行人跟踪的目标是确定每时每刻每个对象的位置。行人轨迹预测是基于行人的历史观测数据对行人未来的行进轨迹进行预测。它们可以应用于视频监控、分析,运动和人群行为分析,自动驾驶又或者可疑和异常情况的检测。多相机下的目标跟踪有很多挑战,例如长时间的遮挡、相机设置、视角和行人姿势的巨大变化,因此它更加依赖可靠的外观特征。在行人轨迹预测问题中,当人们在人行道,地铁和机场等拥挤的空间中行走时,他们自然会根据场景上下文调整行走方式,并遵循共同的社会礼节,例如保持隔离和避免碰撞。这些隐含的交互关系会导致复杂的群体运动,对准确地轨迹预测造成了极大的挑战。本课题针对上述挑战,提出了一种基于人体部位语义特征的多相机多行人跟踪方法,基于二分支深度神经网络提取全局外观特征、构建人体部位语义特征图,并以二者融合为基础组装了一个多相机多行人跟踪处理流水线。提出了一种基于图神经网络的行人轨迹预测方法,构建了以无监督方式推断行人间交互关系的图神经网络模型,支持并发预测行人未来轨迹。通过在多相机多目标跟踪和行人轨迹预测公开数据集上的实验,本文对实现的方法进行了性能测试与评估。测试结果表明,提出的方法相比于现有的方法在各项性能指标上都取得了较好的提升。本文的研究为解决多目标跟踪相关问题提供了新的研究思路和方案,也为更高级别的应用系统提供了支撑。
其他文献
程序自动修复技术为软件调试、软件维护等任务带来了极大的便利,因而引起了研究人员的广泛关注,越来越多的方法被提出以更好地解决修复问题。然而,这些技术在测评环节中存在着多种偏差,使得研究人员不能够全面地客观地分析当前技术的修复能力。本文针对当前的修复工具测评环节中的三类偏差进行研究,内容涵盖程序修复流水线上三个环节(缺陷定位,补丁生成,与补丁验证)中的两个(缺陷定位与补丁验证)以及缺陷数据集的选取,旨
近几年来,深度卷积神经网络(Deep Convolution Neural Network,DCNN)在语义分割任务上取得了显著的进展,极大地提高了语义分割的准确性以及处理效率。在自动驾驶视觉传感器采集的图像中,语义分割方法通过像素级的标注及时精准地获取道路空间方位和障碍物轮廓等信息,已经成为驾驶视觉场景下实现自主规划和主动避障的主流解决方法。对于这类对实时性要求高的应用,如何在保持高效的推理速度
作为现代图像系统的重要部分——多光谱与高光谱图像为探测地物目标提供了丰富的空间信息与光谱信息,在民用与军事领域均有很深的应用价值。与其相关的图像处理技术包括图像搜索、增强、融合、语义分割、异常检测与图像分类等。本文针对多光谱图像融合技术与高光谱图像分类技术进行了深入研究,主要工作包括:(1)本文提出了一个由RLNSST算法与引导滤波器结合的新型融合算法。在深入理解图像融合技术基本理论的基础上,本文
作为一项典型的计算机视觉任务,人群计数的目标是精准高效地统计视频或图片等载体中所含有的总人数。目前,人群计数任务已在公共安全领域的诸多方面得到大力推广和积极应用,越来越多的学者开始将其作为研究课题进行专项讨论。基于采取的方法或者手段,可将人群计数大体划分为两种:一种是基于回归的人群计数,它主要通过创建的回归模型进行人数统计;另一种则是基于检测的人群计数,它依托成熟的目标检测技术对特定场合中包含的人
随着倾斜摄影测量技术、无人机技术和三维重建技术的快速发展,大范围场景下倾斜摄影测量数据的生产速度有了大幅提升。处于信息化时代的人们,也越来越希望能够通过多种多样的科学技术手段了解自己所处的环境,二维影像所提供的信息已经远远不能满足人们的需求,面向三维可视化的需求越来越多。虽然面向三维web可视化的研究有了诸多进展,但是大范围场景下倾斜摄影测量数据的可视化仍存在诸多问题。例如,分层级数据加载过程中,
近年来,随着开源生态的迅速发展,积累了大量的开源软件资源。在这些数目庞大的软件资源中,不乏质量很高的代码片段,以及其衍生品,如代码摘要、文档等。这些高质量的资源具有丰富的价值。然而在海量的开源资源中,如何挖掘出这些高质量的开源资源,使其能够复用于未来的软件工程之中,仍然面临着许多挑战。本文认为面对大数据背景下的开源资源,需要从两个方面进行着手:理解代码与定位代码。因此,本文提出了进行了如下研究:1
模糊测试是一种常用于软件测试中的技术,其中,灰盒模糊测试技术因为具有覆盖率信息反馈以及快速生成用例的特点而应用广泛,但是它需要大量时间去产生测试用例覆盖程序,所以测试效率仍较为低下。现如今计算资源规模庞大,利用分布式计算资源可以加速灰盒模糊测试过程,这个方法区别于传统改进算法,并与其他方法可以相互增益。本文针对大规模分布式并行的持续性模糊测试技术展开了研究。第一,本文采用了以数据库为中心的架构用来
伴随着开源理念的赓续提高,开源社区的发展日新月异,孕育了海量的开源软件,软件资源高度分散而且良莠不齐,难以用传统单一、封闭的方式对开源软件进行评估进而检索优质软件。因此,提出一种新的开源软件排序算法是非常有意义的。本文提出了一种对软件进行综合评估的新方法,从客观和主观两个层面来综合评估软件。客观上采用文本匹配及基于隐式的结合方法,建立开源软件在软件主体社区及软件衍生社区的关联,进而量化软件在软件衍
自然语言理解是任务型人机对话系统中的基础性研究工作,对于给定用户输入,旨在把自然语言转换成计算机能够理解的结构化语义表示。自然语言理解由意图识别和槽填充组成,其中意图识别完成对用户意图的判断,槽填充完成对用户输入实体的抽取,通常使用多任务学习来同时完成两个任务,相关技术目前成为学术界研究的焦点。本文基于深度神经网络模型,对自然语言理解任务进行了研究,研究内容包含两方面:首先,自然语言理解模型通过使
近年来,开源生态与开源软件发展十分迅猛,越来越多的开发者都参与到开源软件的开发中。在开源生态社区中开发者可以自由自在地同时进行多个任务,通过互联网环境实现交互和协同。例如在Git Hub社区中开发者可以同时关注讨论多个开发任务,或者同时审阅讨论多个代码贡献。大规模群体的积极参与和多任务协同是开源生态持续成长的关键因素和重要驱动力。探索多任务协同对开发者工作效率的影响是十分有意义的研究,可以指导开发