基于视觉系统的行人检测与跟踪方法研究

来源 :上海交通大学 | 被引量 : 9次 | 上传用户:jiguso198735
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于计算机视觉的行人检测与跟踪已日益成为国际上模式识别、计算机视觉和人工智能领域最活跃的研究主题之一,其在智能视频监控、智能交通、高级人机交互、异常行为分析以及虚拟现实等领域都有重要的应用。其核心是利用模式识别研究领域的理论成果,结合计算机视觉技术从视频序列中检测出行人并对其进行跟踪,该研究主题涉及图像处理、模式识别、系统状态估计、概率与统计推理等多个理论学科。同时,基于计算机视觉的行人检测与跟踪作为一种关键技术,是计算机视觉更高层次行为理解与分析的基础,它的检测精度和跟踪的鲁棒性直接影响到后续的各种诸如目标识别、行人运动分析及行为的描述与理解等高级应用处理。基于机器学习统计分类的行人检测算法有两个关键问题与检测效果密切相关,第一是行人特征的设计和提取,第二是分类器的选择和构建。针对行人检测,本文主要研究基于机器学习统计分类的行人检测算法。该类检测方法的关键在于对目标类别外观形状的描述方式、有效的图像特征提取及设计合理高效的分类器。对于行人特征的设计和提取,本文根据行人外观或形状存在总体上的一致性特征,再加上行人相比于其它目标类别的显著特性,如几何上的双侧对称性、行人直立产生的特有轮廓等特点,提出了三种能很好地反映人体本质属性的人体特征,分别为相关颜色相似性特征、随机颜色相似性特征和基于显著性的二值化特征。在分类器的选择和构建方面,本文选择基于半朴素贝叶斯的随机Fern分类器来对候选样本进行分类,取得了很好的分类效果。另外行人检测的实时性也是需要考虑的问题,对此本文也讨论了在红外场景下如何提高行人的检测速度。在复杂场景下,视觉跟踪通常都是非高斯、非线性的状态估计过程。粒子滤波是处理非高斯、非线性状态估计问题的有力理论工具,也是构架视觉跟踪算法的完备理论框架。同时,在粒子滤波理论框架下可以很容易地通过观测概率合成实现多视觉特征的融合跟踪,基于此,本文提出了基于粒子群优化的多视觉特征权值自适应粒子滤波跟踪算法。对行人目标进行跟踪的另外一个挑战是人体是结构复杂的非刚体,在运动过程中有较大的姿态变化,对此本文提出了基于特征块和稀疏表示的行人目标跟踪算法。该跟踪算法可以实现对行人的精细化跟踪,即不但可以对整个人体作为一个整体来跟踪,而且还可以实现对人体的肢体运动有更为细化的跟踪。本论文主要研究内容为如何提高基于视觉的行人检测精度和基于视觉的行人目标跟踪的稳健性,针对人体检测和跟踪中存在的特定问题,提出了行之有效的解决算法,本论文创新点主要体现在:1、颜色特征在计算机视觉研究领域是非常流行且受欢迎的一种底层特征,本文利用这个信息量丰富的底层特征,提出了一种基于颜色空间的行人特征描述子,称为相关颜色相似性特征(relationalcolorsimilarityfeature,rcs)。该特征描述子不是局限于直接用颜色本身亮度值,而是通过一定的准则把颜色特征进行转换,映射到其它特征空间,对于映射后得到的人体特征描述子,其外在表现已经与颜色本身没有直接联系,却能很好的描述行人固有的双侧对称性和直立特性。2、基于半朴素贝叶斯算法的随机fern分类器有较好的分类性能和较快的分类速度,为了更进一步提高其分类速度,本文采用二值特征来对该分类器进行训练,对此,本文在相关颜色相似性特征(rcs)的基础上提出了随机颜色相似性特征(randomcolorsimilarityfeature,rancs)。同时,又因为人的服饰相比于周围自然场景有特有的纹理,这些在人类视觉系统看来具有很强的“显著性”,尤其是人体和背景接触的边缘部分,“显著性”更为突出。基于此,本文提出了基于显著性的二值化特征(saliencybasedbinaryfeature,sbf)。3、在红外场景下,针对目前逐行列逐像素的遍历检测方法所带来的检测速度和效率较低的问题,为了提高红外场景下的人体检测速度,本文提出了基于显著性检测的预处理方案,该预处理方法首先采用显著性检测算法快速地提取出可能包含行人的区域,然后在此区域上进行人体检测,这在一定程度上能大大提高人体的检测速度。4、在实际场景中,基于单一视觉特征的目标跟踪算法随着场景的变化很难实现稳健的跟踪,为了提高跟踪算法的鲁棒性,提出了基于粒子群优化多特征权值自适应的粒子滤波跟踪算法,通过对复杂场景下的行人目标进行跟踪验证了该多视觉特征权值自适应融合跟踪算法的有效性。5、针对行人姿态多变的非刚体特性,提出了基于特征块和稀疏表示的行人目标跟踪算法,以此来实现对行人目标的精细化跟踪,即可以实现对运动行人肢体的细化跟踪。采用稀疏表示的方法是因为图像的稀疏表示本身对噪声和局部遮挡不敏感,以其作为观测模型,可以减弱背景噪声和局部遮挡对跟踪算法产生的不利影响。采用特征块的跟踪可以实现对运动行人肢体的细化跟踪。同时,采用一种增量学习的方法来对目标模板进行在线更新,以适应光照、行人姿态变化等因素引起的目标外观变化。实验结果表明该算法对于行人的外观和姿态产生较大变化时也有稳健的跟踪效果。
其他文献
新课改形势下的语文教学不是要生硬地灌输知识,而是要让学生有兴趣学语文。如果一个语文老师已经让学生产生厌烦上课的话,这位老师应该是失败的。现代教育观强调教学要以学生为
作文教学是一项十分艰巨而又带有创意的工作,并无固定的模式,也不应仅仅局限于课本,要注重厚积薄发,注重培养学生的写作兴趣。兴趣是最好的老师,有了兴趣,学生的学习内驱力才会被极
子宫颈机能不全是由于先天发育不全和后天损伤所致,是反复晚期流产、早产的主要原因,其发生率为0.27%~1.84%。诊断宫颈机能不全可根据病史、临床表现及B超检查结果。只要有反复中晚期流产、早产史,流产前无先兆症状,胎儿娩出极快,要高度怀疑宫颈机能不全。我院自1996年10月-2007年10月采用宫颈环扎术治疗18例宫颈机能不全患者,取得满意效果,现报告如下。
<正>为贯彻落实十七届中央纪委第七次全会、国务院第五次廉政工作会议、总行2012年纪检监察工作会议精神,进一步强化农业银行干部员工廉洁从业意识,规范权力运行,健全完善廉
<正>"顺德村级工业园区整治任务重,要想方设法加快绿色工业服务中心建设。"5月18日,佛山市委副书记、市长朱伟在佛山市生态环境督察暨环保联动执法电视电话动员会上对顺德的"
文章对各高校体育舞蹈的教学现状进行分析,并通过构建教学效果评价体系的原则和教学评价的设计进行评价,旨在为各高校进一步提高舞蹈教学效果的综合水平提供借鉴。
由于某景区经营权回购需进行景区游客量长期预测。为克服长期预测的不确定性,我们采用基于旅游地环境容量的LOGISTIC模型和考虑客源地旅游需求的回归迭代模型进行组合预测。