论文部分内容阅读
目标检测是对图像中的目标进行定位和分类的技术,在图像处理领域具有重要的科学意义和应用价值。本文针对高分辨率航拍图像小目标实时检测的需求,通过分析航拍图像目标检测的难点,及比较现有算法的检测精度和速度,选择以YOLOv3算法为基础进行复杂背景下的小目标检测算法研究。YOLOv3算法性能优越,但其在航拍图像检测中存在小目标漏检和地物干扰下误检的问题,本文在深入研究该算法和航拍图像特性的基础上,对其进行了改进,在保证实时检测的同时提高了航拍图像小目标检测的质量。本文主要的研究内容和创新点如下:(1)针对航拍图像小目标检测模型训练的需求,本文选择了5个公开的航拍遥感图像数据集,筛选出飞机、汽车、船三类目标,制作了航拍小目标数据集ASOD。为解决YOLOv3算法的初始锚框尺度与航拍图像目标尺度不符导致的检测精度下降问题,根据航拍目标的尺度分布特点重新设计了初始锚框。本文使用K-means++算法对航拍目标进行聚类,将聚类结果作为初始锚框。通过对航拍小目标图像的测试,使用聚类锚框的检测mAP比原算法提高了0.5%,而且不会影响检测速度,本文后续改进算法中都使用了聚类锚框。(2)为解决航拍图像小尺度目标容易漏检的问题,提出了增加高分辨率特征融合的改进算法YOLOv3-F。相比普通图像,航拍图像小目标比例高且目标尺度小,而YOLOv3算法检测层的分辨率低,无法有效描述小目标的特征,不适合航拍小目标的准确检测,本文在YOLOv3原有检测层特征的基础上融合了更高分辨率的特征层,有效提升了小目标的检测精度。在输入图像分辨率为416?416时,YOLOv3-F算法在ASOD数据集上的检测mAP为89.1%,相比YOLOv3提高了1.6%,而且该算法在GTX 1060显卡上的检测速度为21.9 FPS,相比YOLOv3仅降低了9.9%。(3)为解决航拍图像在地物干扰下容易误检的问题,本文结合RFBNet的感受野块结构和DenseNet密集连接的思想,提出了一种新的感受野增强结构DenseRFB,之后在YOLOv3-F的基础上设计了嵌入此结构的改进算法YOLOv3-DF,在检测速度损失很小的前提下进一步提升了检测精度。当输入图像大小为416?416时,YOLOv3-DF算法在ASOD数据集上的检测mAP为90.4%,相比YOLOv3-F提高了1.3%,相比YOLOv3提高了2.9%,而且该算法在GTX1060显卡上的检测速度为20.8FPS,可以达到实时检测。为验证DenseRFB结构的泛化能力,在VOC2007数据集上测试了嵌入此结构的改进算法性能,其检测mAP达到了80.8%,比YOLOv3提高了3%。