基于改进Faster RCNN的行人检测研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:and113
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习算法研究的不断深入,目标检测领域受到了越来越多研究者的关注。行人检测作为计算机视觉和模式识别任务中重要的子课题,有着非常广泛的应用场景,如自动驾驶、智能监控、智能机器人等。本文研究了近些年经典的卷积神经网络的国内外研究现状,还介绍了卷积神经网络的设计准则与优化方法。近年来,采用深度学习算法进行行人检测可在很多公开的行人数据集进行测试,且其实验结果要远远高于传统的机器学习算法和其他的图像处理算法。在视频和图像中,由于距离、光线不足或阴影干扰等因素,使得部分行人的像素较小,导致一些行人检测方法很难检测出这类小像素行人目标,导致增加了误检率。针对以上问题,本文采用改进的Faster RCNN算法对行人进行检测,主要研究内容包括:1.为了对卷积神经网络的输出特征有更直观的观察,我们通过特征图可视化的方法,发现浅层网络提取的是纹理和细节特征,它包含更多的特征。深层网络提取的是轮廓形状和突出特征,提取的特征更具有代表性,但细粒度信息会减少。在本文中,融合了不同卷积层输出的特征,提取的特征结合了低层信息和高层信息的特点,对小目标行人特征的描述更具代表性。最后分析实验结果,结合融合特征后的Faster RCNN网络在INRIA数据集上的误检率降低至10.31%,在Caltech数据集上的误检率降低至24.27%。2.在目标检测任务中,网络的性能很大地影响了检测的效果。本文中,在Faster RCNN模型的基础上,结合SENet(Squeeze-and-Excitation Networks)获取到每个特征通道的重要程度,提升有用的特征并抑制对当前任务用处不大的特征,这样通过特征通道之间的关系来提升网络的性能。结合SENet的Faster RCNN行人检测算法并没有增加过高的复杂度。实验结果表明,结合SENET的Faster RCNN在INRIA数据集上的误检率降低至10.20%,在Caltech数据集上的误检率降低至13.14%,改进模型在提高了检测准确率的同时,检测速度也有所提升,检测每张图片仅需0.28s。
其他文献
对流层延迟是制约GPS定位精度提高的主要误差源之一。在实际测量工作中,通常采用模型法进行消除,但是由于气象代表性误差及气象元素测定误差的影响,导致对对流层延迟的预测精
随着社会的进步,我国的建筑业得到了快速的发展,在人们的物质生活越来越好的时代,对建筑的质量有了更高的要求,要求建筑要有很高的舒适性及保温性。那么本文对于建筑在外墙的
<正> 在现在保存下来了的鲁迅手稿中,我们通常只能看到他对字句的修改,几乎没有看到过他整段整页删去近乎彻底重作的情形。现在已经发现的这方面的唯一的例子,是《<准风月谈>
滇池是我国污染最为严重的湖泊之一,导致滇池污染的主要原因是入湖河流的污染。因此,云南省投入巨资对入湖河流开展综合整治工程,尤其在城市型入湖河流的治理上投入力度最大。为研究已完成的综合整治工程的治理效果,论文选取两条不同的典型城市河流——采莲河和枧槽河,进行了为期一年的水质和生态调查及监测,全面评估河流的治理效果。并在调查资料和监测结果的基础上,结合城市型入湖河流的特点,基于层次分析法对治理后的河流
随着税收征管体制改革的深入推进,加强基层税务干部队伍能力素质建设,既是提高税收征管质量的现实需要,又是推进税收治理体系和治理能力现代化的客观要求。能力素质模型作为人力资源管理的有效手段,被广泛应用于企业及社会组织的人才招聘、选拔、任用、培养等实践活动中,在推动企业人才建设、促进企业发展中发挥了重要作用,其科学性、有效性在实践中得到了验证。目前,能力素质模型在国内政府部门工作人员中的研究应用还处于探