论文部分内容阅读
遥感图像场景识别可以对遥感图像的语义内容加以解释,并且有助于完成遥感图像分类、目标检测等任务。近年来,深度卷积神经网络被广泛的应用于图像分类、图像目标识别等领域并取得了很好的效果。卷积神经网络可以提取图像高阶的、抽象的特征而这种提取图像特征的能力正是在遥感图像场景识别任务中所需要。因此本文将卷积神经网络用在遥感图像场景识别任务中。针对深度神经网络模型消耗大量内存和计算资源的情况,本文将深度模型压缩方法用于遥感图像的场景识别模型中,通过网络剪枝和权值共享与量化等操作在不大规模影响模型性能的前提下实现对模型规模的压缩。首先对卷积神经网络的基本结构和训练过程进行介绍,根据实际情况选择本文实验所使用的网络结构和重要参数。本文以AlexNet为基础网络,通过研究不同的卷积层层数、不同卷积核的数量、不同的初始学习率以及训练过程中不同的学习率更新频率等四个方面对最终识别准确率的影响,确定了实验所使用的网络结构与重要参数的数值,对于数据集AID文中所采用网络的初始准确率为96.2%,然后使用PReLu函数代替ReLu函数作为卷积神经网络的激活函数,进一步将模型的识别准确率提高为97.1%,训练完成后得到基于卷积神经网络的遥感图像场景识别模型。最后对模型各层进行了可视化分析。卷积神经网络的强大性能依赖于其数以千万计的参数以及复杂的网络结构,这也使得卷积神经网络在训练过程中需要消耗大量的内存以及计算资源,针对上述情况本文对网络模型使用深度压缩的方法:包括网络剪枝和权值共享与量化两部分。首先需要分析训练得到的用于遥感图像场景识别的深度神经网络模型的权重数值,通过提出的阈值选取方法对其进行剪枝操作,通过去除模型中的不重要连接实现网络的去冗余化,然后使用改进的K-Means算法对剩余连接进行聚类操作以实现权值的共享与量化。经过上述两步操作,模型的识别准确率从97.1%下降到95%,模型的规模从240M压缩到20M。