论文部分内容阅读
由于计算机性能和数据爆炸式增长,深度学习算法应运而生。深度学习算法研究的领域众多,包括自然语言处理,自动驾驶,计算机视觉等等。而目标检测是计算机视觉里面热点的研究方向之一,目标检测在安防监控、自动驾驶、人脸识别,医疗影像等方面有着重要的研究意义。深度学习的发展,让基于深度学习的目标检测算法如雨后春笋般的产生和提出。都在致力提升目标检测算法的性能,提高mAP(mean Average Precision,各类别平均精度的平均值)和FPS(Frame Per Second,每秒帧率)的值,来满足工业界的需求。为了提高目标检测算法的检测精度,本文基于IOU(Intersection over Union,预测框和真实框的交并比)提出了新的损失函数。为了进一步优化损失函数,本文先提出了IIOU(Improved Intersection over Union,对预测框和真实框交并比的优化),基于IIOU又提出了新的损失函数。用新提出来的损失函数和损失函数替换YOLOv3算法中原始损失函数,在MSCOCO(Common Object in Context,微软2014年发布的公开数据集)数据集上做测试,表明新提出来的两种损失函数均提升了YOLOv3算法的平均检测精度。对NSM(Non-maximum suppression,非极大值抑制)算法进行了优化,减少漏检的现象。上述提到的目标检测算法的损失函数都是L1或者L2损失函数。于是本文提出了损失函数来替换YOLOv3算法中原始损失函数。在MS COCO数据集上做实验,得到mAP的值为59.38,原始YOLOv3算法mAP值为57.9,作为YOLOv3的损失函数比原始的YOLOv3算法mAP值提高了1.48。但是IOU仍然存在问题。继而本文提出IIOU来解决IOU存在的问题,然后提出了新的损失函数来优化损失函数。把YOLOv3算法中损失函数替换成,在MS COCO数据集上做实验,得到mAP的值为60.77,比作为YOLOv3算法的损失函数mAP值提高了1.39,比原始YOLOv3算法mAP值提高了2.87。为了提高系统鲁棒性,对YOLOv3算法进行了扩增数据集训练。本文最后基于改进的YOLOv3算法实现了一个目标检测系统,实现用户上传视频或者图片,完成目标检测的标注,返回结果给用户。同时对系统工程质量进行严格把控,经过测试,系统功能处于稳定状态。