论文部分内容阅读
近年来,目标检测技术发展迅速,各行各业都可以看到目标检测技术的身影。经过十几年的发展,各式各样的目标检测算法被提出,目标检测的准确率越来越高,但是小目标检测的效果却一直不尽如人意。由于小目标尺寸较小,提取到的特征少,匹配的锚点框少,从而不易被检测。小目标检测需要综合多个尺度特征信息。当前目标检测特征提取采用基础骨干网络结合特征金字塔(feature pyramid networks,FPN)的方式来提取不同尺度特征。FPN在特征融合时只融合了相邻层的特征,非相邻层的特征被稀释,不利于小目标检测。当前感兴趣区域提取主要采用的是手工设置锚点框方式。手工设置的锚点框形状大小单一,不能很好的覆盖小目标,导致锚点框的小目标召回率过低,不利于小目标检测。本文针对现有目标检测框架对于小目标检测的以上缺陷,提出了一种基于密集融合的特征金字塔网络(Dense fused feature pyramid network,Dense FPN)。Dense FPN将各个尺度的特征图直接跳跃连接到特征金字塔,特征金字塔可以直接融合所有尺度特征图信息,减少了信息在网络传递过程中的消耗,增加了特征金字塔每层特征的丰富度。本文提出一种基于可形变卷积的锚点框生成网络结构(Deformable Convolutional Network Based Guided Anchoring,DCN-GA)。DCN-GA通过网络生成各种形状大小的锚点框,不再需要预设锚点框。DCN-GA生成锚点框时使用可形变卷积来解决小目标形状大小不规则的问题。DCN-GA提高了锚点框对于小目标的召回率。本文最后将Dense FPN与DCN-GA融合在同一网络中,在MS COCO数据集和基于虚拟仿真环境下的自动驾驶交通标志数据集上进行实验,然后将实验结果与现有的小目标检测算法对比分析,实验结果证明本文提出的方法有效地提高了小目标检测精度。