基于深度神经网络的上下文信息目标检测算法研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:billhe123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来互联网等技术迅猛发展,计算机视觉的研究也越来越火热。目标检测是计算机视觉的研究重点也是一个难点。在日常生活场景中,图片成像时会受到外界环境的变化以及各种干扰因素的影响,使图像中物体的形态受到极大影响,导致物体间形成差异。由于图像成像时受到如成像角度、成像的天气与光线、物体的背景和成像拍摄距离等干扰因素的影响,即使一些物体属于同一类别也可能出现检测错误,甚至一些物体无法被检测出。因此,本文为进一步优化目标检测任务,主要做了以下工作:(1)首先介绍目标检测的研究背景及意义,简述深度神经网络的组成,以及基于候选框和基于回归的目标检测过程。指出在目标检测场景中,存在许多干扰因素影响目标检测,针对此类问题和现象,选择添加上下文信息作为目标检测的辅助信息。(2)考虑到提取单层或者是最后一层卷积层对应的上下文可能导致信息量匮乏,提出基于多层上下文的卷积神经网络(MLC-CNN)的目标检测算法,提取多层上下文信息特征并结合物体特征进行目标检测。介绍了实验数据集的结构和特点,与没有添加上下文信息特征的经典算法Faster R-CNN和一些添加上下文信息特征的目标检测算法进行实验对比,对实验结果详细地分析,验证MLC-CNN算法对于目标检测的有效性。(3)通过对一些研究上下文信息的目标检测算法的实验结果进行分析,发现无差别的加入上下文信息,可能没有达到最好的效果。提出基于差异度选择上下文的卷积神经网络(SCD-CNN)目标检测模型,该模型通过添加差异度模块,衡量是否添加上下文信息特征来辅助目标检测任务。提取目标候选区域特征和多模块上下文信息特征,计算二者之间的差异度并与阈值比较,自适应选择是否融合上下文信息。通过对实验结果详细地分析,验证算法对于目标检测的有效性。
其他文献
近年来,随着社会的进步和人们生活水平的提高,人们对电子产品的需求量也越来越大,电子产品需求量的日益增加,就带动了组成电子产品的电子元件需求量增加,同时也对电子元件的
21世纪以来,国内公民生活水平不断攀升,公民参与体育运动的需求日益膨胀。足球作为三大球之一拥有很强的参与性,近年来,我国足球人口越来越多,球迷基础日益深厚,世界杯的举办吸引了球迷的注意,在我国也越来越受欢迎,达到一种狂热状态。世界杯预热周期越来越短,世界杯一旦开赛,受众会很快进入状态,朋友圈、微博、新闻APP上,人们所见之处都是世界杯。媒介作为一种传播体育赛事的重要手段,媒介报道如何吸引观众,如何
近些年来,机器人逐渐成为科技、经济和社会的热门话题之一,逐渐被应用于各行各业中,比如工业生产、家居服务、教育娱乐等方面。随着人机互动的需求越来越多,出于任务目的、人
随着光纤激光打标机功能越来越完善,光纤激光打标机插补算法的研究和应用软件开发便成为一个重要应用价值的课题。伴随着激光技术、计算机信息技术、数控技术与微电子技术的
平面折反射摄像机由一个针孔摄像机和双平面镜构成.当双平面镜的夹角发生变化时,双平面镜之间存在一次或多次内部反射,而物体在双平面镜装置中会发生一次或多次反射成像.当双平面镜存在一次内部反射时,物体在双平面镜装置中会形成四个反射虚像.通过分析物体在平面镜中的成像性质,提出了两种标定摄像机内参数的方法.在双平面镜装置中,由任意一个空间点形成的反射点位于同一圆上,且这些圆是共轴的平行圆.根据平面镜成像的对
十八世纪,欧洲爆发了一场声势浩大、规模空前的思想解放运动——启蒙运动,以百科全书派为代表的狄德罗、孟德斯鸠、伏尔泰等一批激进的启蒙思想家高举“理性至上”的旗帜,一切生活规则皆出自理性。启蒙学者过分夸大理性,忽略了情感。卢梭敏锐的察觉到现代文明社会的弊端,文明社会的演进造成了社会的不平等和不自由,又导致了人性的堕落、道德的沦丧。卢梭在深刻的反思与批判的基础上转向道德情感,对情感倍加关注与重视。他以自
视频广告屏蔽行为是利用视频广告屏蔽技术将广告商投放在视频播放前或播放中的广告屏蔽,从而达到消费者无需观看广告直接观看视频的效果。司法实践中,新《反不正当竞争法》颁
本文设计了一套融合RFID和气体传感网定位的信息采集系统,可实现对有毒气体浓度的检测、泄露源的精准定位和采集RFID标签信息等功能。本系统排除了人为检测的危险,并根据电子
目的:通过探讨大动脉粥样硬化型(large-artery atherosclerosis,LAA)缺血性脑卒中(ischemic Stroke,IS)及小动脉闭塞型(Small-artery occlusion,SAO)缺血性脑卒中血栓弹力图(Thromboelastography,TEG)参数(R值、K值、Angle角、MA值)之间表达的差异,以及血栓弹力图参数与凝血指标纤维蛋白原(Fibrin
计算机视觉对三维重构的精确性有较高的要求,而三维重构的精确性与摄像机内参数有着十分重要的联系.一般来说,双平面镜折反射系统由两块平面镜和一个传统摄像机组成.该成像系统能产生一个物体的多个视图,利用物体的多个视图不仅能完成摄像机标定,而且通过它们可以重构出较为精确的三维模型..因此,双平面镜折反射系统具有重要的研究价值和意义.利用双平面镜折反射系统产生一个物体的五个视图.在透视图像上取五个点,其中一