论文部分内容阅读
基于深度卷积神经网络的目标检测算法的定义是利用深度卷积神经网络构建模型,之后利用模型对给定的图片或视频中感兴趣的目标进行定位和识别。根据算法的结构中是否包含区域建议模块,基于深度卷积神经网络的目标检测算法的模型可以划分为单阶段检测算法和二阶段检测算法,两者在自动驾驶、行人重识别、人脸识别等领域得到了普遍的应用。其中单阶段检测算法在检测速度上相较于二阶段检测算法占有优势,但是在检测准确率上相对劣势,通过改进算法的网络结构的方法可以弥补单阶段算法的不足。在实际应用中,基于深度卷积神经网络的目标检测算法的模型存在参数量过大、占用大量存储空间的不足,通过对算法模型进行轻量化改进,使得算法在满足准确率和检测速度需求的同时减少参数量,从而降低模型的存储大小。因此,针对基于深度卷积神经网络的目标检测算法的研究,在学术上和实际应用上都有着重要的价值。本文主要针对的是单阶段检测算法中的YOLO v3和FSSD进行结构的改进以提升算法的检测速度和准确率,主要研究工作如下:1、提出了一种基于改进的YOLO v3的目标检测算法。该方法主要是利用深度可分离卷积构建的MobileNet网络对YOLO v3算法中的DarkNet-53网络进行改进,来减少模型中的计算消耗,提升模型的速度。并且在MobileNet网络中引入通道注意力机制,以此来提升网络提取特征的能力,提升模型的准确率。在RSOD遥感数据集、LEVIR遥感数据集和NWPUVHR-10遥感数据集上进行实验证明改进后的算法相比原算法在速度上有所提升且保持了原算法的准确率。2、提出了一种针对FSSD算法的轻量化改进方法。该方法主要是针对现有的利用MobileNet替换FSSD算法的骨干网络的轻量化方式进行改进,将FSSD算法的骨干网络用改进后的ShuffleNet进行替换,并且利用双向特征金字塔结构来改进模型中的特征融合操作,使得融合后的特征具有更丰富的语义信息。在PASCAL VOC 2007+2012数据集和安全帽检测数据集上进行实验后结果证明,该方法使得轻量化后的算法在准确率上有所提升。