基于深度学习的人群密度估计

来源 :青岛大学 | 被引量 : 0次 | 上传用户:jinyeqin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,人群计数因其广泛的应用,如公共安全、避免拥挤、流量分析等,引起了人们的广泛关注。人群计数的目的是估计由监控摄像头提供的拥挤图像或视频中的人数。利用计算机视觉技术进行准确、稳健的人群数量估计,对公共安全具有重要意义。目前人群计数的研究趋势已经从计算人数发展到通过密度图显示人群分布。一般情况下,由于复杂的人群场景受各种因素的影响,包括背景噪声,闭塞,和尺度变化,因此产生准确的人群密度图,并在高度拥挤嘈杂的场景进行精确的人群计数是具有挑战性的。现有的基于神经网络的方法往往使用多个输入或多个网络模型来提取尺度相关特征,但这样不可避免地会增加计算负担。另外多数的人群密度估计方法仅仅使用最后一层的特征进行预测,忽略了中间层的特征信息。因此针对上述问题,本文进行了如下工作:1.提出了一种基于卷积神经网络的静态图像密度估计方法,称为基于多尺度空洞卷积的人群密度估计(MScCNN)。该方法利用单列网络进行特征提取,结合多尺度空洞卷积进行多尺度信息聚合,解决了多输入和多网络方法的不足。多尺度空洞卷积模块在不降低感受野的前提下,利用空洞卷积对多尺度上下文信息进行系统的聚合,从而将底层细节信息集成到高层语义特征中,提高算法对小目标的感知能力。2.为了充分利用中间层的特征信息,设计了另一种基于卷积神经网络的静态图像密度估计算法,称为基于多阶段特征的卷积神经网络人群密度估计(MStCNN)。网络结构分为两个部分,一部分使用经过预训练的并且拥有强大传输能力的VGG16基础网络;另一部分是多阶段特征融合网络,对VGG16不同最大池化层的特征使用空洞卷积做进一步的密度图拟合。该方法充分使用不同阶段特征,即包含低层的语义特征又包含丰富的高层语义特征,获得很好的拟合效果。3.设计了将前两种算法相结合的算法,即基于多阶段和多尺度特征的卷积神经网络人群密度估计(MStScCNN)。考虑到前两种网络分别对中间层特征和不同尺度特征的网络结构,该方法将以上两种网络的相结合,获得更加丰富的上下文信息,充分使用不同阶段特征和不同尺度的特征,拥有三个算法中最好的拟合效果。最后,本文在ShanghaiTech数据集、UCF_CC_50数据集和Worldexpo’10数据集上对所提出的两个网络结构进行了论证,并将结果与目前主流的人群计数算法进行了比较,证明了本文的方法优于目前的最新方法,具有很好的计数精度和鲁棒性。
其他文献
增广类别学习(Learning with Augmented Class,LAC)是应对开放动态环境问题的重要方法,而大多数现实应用都面临着开放动态环境的问题,因此LAC方法的研究有着重要的现实意义。
在全球气候变暖和环境污染的压力下,人们对汽车发动机有害气体的排放越来越重视。燃油经喷油器喷入燃烧室后会出现雾化现象,雾化质量会影响有害气体的排放,而柴油液滴与金属
妇科分泌物常规检查是最常见的妇科检查项目,该项检查的主要目的是检查阴道是否有炎症,并进一步确定炎症的类型。同时,该检查也常用于宫颈癌的初筛。临床上现有的人工检查方
广义频分复用(Generalized frequency division multiplexing,GFDM)作为一种数据块结构的多载波调制方案,具有结构灵活,带外辐射低,频谱利用率高等特点,是超5代移动通信系统
根据研究表明,爆炸的破坏效应主要是由冲击波引起的,冲击波作为其主要杀伤因素,具有远距离破坏目标的作用。在复杂外界环境条件下,冲击波传播机理的确定对于这些武器的威力评
广度优先搜索(BFS)是许多图形应用程序的底层内核算法,如社交网络,医疗信息学,传输系统等。因此,它已被吸收为Graph500的核心,用于评估超级计算机大数据处理的能力。本文依托
油棕(Elaeis guineensis Jacq.)是世界上产量最高的油料植物之一,因其果实含油量高以及单位面积产油量大而被誉为“世界油王”(雷新涛,曹红星etal.2012)。作为最具特色的热带
三元V-VI-VII化合物锑硫碘(SbSI)是一种集压电、热释电、铁电、光电等多种性质于一体的特殊材料,其物理性质决定了在多个领域具有广阔的应用前景。本论文主要以SbSI微米棒为研
长江冲淡水与周围海水发生混合、层化作用,对东海及其相邻海区环流结构、水团组成、泥沙沉淀、生态环境和海洋生产力有重要影响。以往对长江冲淡水的研究已经相当充分,但多为
现场离水辐射测量是建立高精度星地光谱信息模型的基础,但是由于船载水上非稳态的测量几何,以及水体流速、悬浮泥沙含量等要素的动态性,给光谱反射率测量带来很大误差。因此