论文部分内容阅读
近年来,世界各国大力发展航空航天事业,卫星图像的目标检测在各行各业的应用得到了快速的发展,特别是军事侦查、海洋船舶和渔业管理等领域。由于卫星图像中有价值的信息极少,卫星图像数据规模巨大,这迫切需要智能辅助工具帮助相关从业人员从卫星图像中高效获取精确直观的信息。本文利用深度学习技术去解决卫星图像在目标检测领域的问题。本文首先研究了基于非旋转空间的Faster R-CNN-RBB卫星图像目标检测模型。整体结构以Faster R-CNN为基础进行了改进,首先为了解决网络深度带来的退化问题以及处理小目标物体,使用残差网络和特征金字塔网络相结合的方式构成基础骨干网络;其次使用RoI Align层代替RoI Pooling层,解决RoI Pooling层两次量化信息丢失而造成的特征区域不匹配问题。Faster R-CNN-RBB的不足之处在于无法精确定位卫星图像上的目标,并且检测速度较慢。针对上诉问题,本文研究了基于旋转空间的Darknet53-RBB卫星图像目标检测模型。首先为了应对目标实例的角度会随着图像缩放而改变的问题,本文实现了角度转换算法;其次设计两种旋转框坐标用于改善回归训练;然后在先验框中添加角度锚点提升目标检测效果;最后提出了使用逐边裁剪算法和Green-Riemann定理计算旋转矩形交叉面积的算法和基于旋转矩形空间的非极大值抑制算法。为验证本文所提算法的有效性,使用HRSC2016、Dota和UCAS_AOD三个数据集对所提出的算法进行验证。在HRSC2016数据集L1、L2和L3三个等级的识别任务上,Darknet53-RBB的均值平均精度高达85.8%、72.3%和56.9%,超出HRSC2016数据集给出的基准10%、9%、6%,Darknet53-RBB在UCAS_AOD数据集的飞机和汽车识别任务上均值平均精度高达92.1%。从可视化的角度上分析,Darknet53-RBB预测的旋转边界框更贴近于目标实例,并且在物体排列密集的情况下能达到更为清晰的检测效果。在运算速度上,Darknet53-RBB最高可达59FPS。同时设计实验验证了基于旋转矩形空间的非极大值抑制算法以及双坐标回归训练方法的有效性。实验结果证明了本文所提算法在卫星图像检测领域有一定的实用价值和研究前景。本文工作对利用计算机辅助检测技术提高卫星图像目标物体的检出率和准确率起到了积极的推动作用。