基于YOLOv2的实时目标检测研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:zhonly
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测是指从图像或视频等输入信息中挑选和识别目标对象。目标检测是机器视觉、神经网络和人工智能的融合点,在图像检索、视频监控和无人机、无人驾驶等领域有广阔的应用前景。随着深度学习在目标检测领域的应用,基于深度学习的实时目标检测发展迅速,如R-CNN系列算法、SSD、YOLO系列算法等,推动了目标检测的快速发展。由于现实环境中的目标对象受到多个因素影响,因此实时目标检测依旧具有很大的挑战性:(1)真实环境存在诸多干扰因素:雨、雾等客观因素,目标旋转、缩放和遮挡等都会对检测产生很多干扰和影响,因此检测过程如何消除环境因素对目标对象的影响;(2)实时检测场景中图像是连续变化,怎样使得检测系统的检测速度达到实时要求,如何提升目标检测速度;(3)检测需求不断提升,比如同一个目标的种类差异化,模型需要对其进行准确分辨,检测系统需要同时准确获取目标对象的类别信息与位置信息,在保证检测速度的同时,检测系统的检测精度也变得至关重要。基于上述实时目标检测场景中存在的多个问题,本文结合YOLO系列算法,提出的统一的实时目标检测模型,主要分为以下几个内容:(1)检测模型可以直接从输入图像回归到目标类别的分数和目标对象所处位置。尽管在实时场景中物体的位置连续变化,依旧可以独立地处理图像。它的单一网络结构在PASCAL VOC2007数据集上以45fps的速度处理图像,具有很好的检测精度和检测速度;(2)结合视频帧间信息的内存映射技术,在实时场景中使用M帧存储器对之前M-1帧的检测,保留视频中丰富的临时帧间信息。将内存映射部分附加到原始网络的最后一层,不会对整个网络结构产生影响,有助于检测模型更好地适用于实时视频流中的目标对象检测;(3)为消除环境因素影响,在模型中增加视频去雾算法模块,采用基于暗通道先验的图像去雾方法,以此增强网络中输入图像的清晰度,降低真实环境中干扰因素对目标对象的影响,从而来提升检测模型的精确度。本文实验首先在ImageNet数据集进行预训练,之后在专门用于自动驾驶的KITTI数据集上进行测试。本文从多个方面对检测模型性能进行了试验分析,同时在多个场景下做了对比实验。KITTI是本文的主要数据集,为了拓宽模型的适用范围此外,在其他三个数据集:Pascal VOC 2007/2012、Road Sign路标数据集以及FDDB面部检测数据集上做了相应的测试实验。实验结果表明:检测模型几种类型的数据集有很好的测试结果,并且可以通过改变模型灵活权衡检测精度与检测速度。
其他文献
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
化疗药物连续刺激对人肺腺癌细胞株耐药、增殖、转移及凋亡相关蛋白表达的影响 目的:探讨常规化疗药物连续刺激对肿瘤细胞株与耐药、增殖、转移及凋亡相关蛋白表达的影响。
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
中央城镇化工作会议明确了城镇化是现代化的必由之路,推进城镇化是解决"三农"问题的重要途径,是推动区域协调发展的有力支撑,是建设美丽东丽的重要抓手,对全面建成小康社会、加
传统礼仪的繁缛、时代的发展以及礼仪规范国际化的趋势导致当前国人在知礼、守礼方面出现了混沌的局面。因此,在构建现代礼仪体系的过程中,在加强礼仪的普及教育、循序引导的
肖邦的《f小调第二钢琴协奏曲》以浪漫主义音乐为基调,融合了许多优秀的民族民间音乐素材,体现出了独特的创作风格。本文就以《f小调第二钢琴协奏曲》为研究对象,从曲式结构
北景/目的 姜茶素是由天然植物活性成分姜黄素和儿茶素组成的,这两种成分副作用极小,几乎无毒性作用。研究证实姜黄素、儿茶素单独应用对肿瘤的的发生都有一定的预防作用,但是
肝细胞癌(Hepatocellar cancinoma,HCC)的发病率呈逐年上升趋势,目前已占所有恶性肿瘤5%以上,全球每年死于肝癌的病人超过500万人。在我国肝癌已成为恶性肿瘤的第二大病因,每