论文部分内容阅读
从高分辨率影像自动或半自动检测物体是遥感领域的一个重要研究课题。具有较高空间分辨率的光学航空和卫星影像与自然图像之间具有较小的特征间隙。因此,可以将深度学习算法应用于遥感影像的识别中。MaskR-CNN是目前最先进的深度学习模型,它具有强大的并行目标检测和实例分割的能力并在自然图像识别方面取得了很大的进展。本篇硕士论文将最先进的计算机视觉和深度学习领域的技术应用到遥感领域。其目的是探究Mask R-CNN在遥感领域的普适性。此外,由于遥感数据也是矢量地图的重要来源,因此该模型可应用在地图上找到遗漏的地理实体并提高矢量地图的质量。在实践中,由于遥感影像数据量大且有实时分析的需求,因此,提高模型训练速度也是非常重要的。首先我们做了一个多类别实验,检测并同时分割运动场地(棒球场,篮球场,田径场,体育馆,网球场)。此外,我们还通过将较深的骨干网络替换为较浅的骨干网络来评估模型的实际适用性。这个实验的目的是针对相对较小的遥感数据集来权衡结果精度和训练速度。此外,我们还在建筑物数据集上训练了一个单类别Mask R-CNN模型。此外,还使用3种不同的建筑密度(密集,中等和稀疏)数据集进行测试。在运动场地任务中,该模型实现了优异的目标检测性能0.956(ResNet101)/0.957(ResNet50)mAP 和 0.887(ResNet101)/0.865(ResNet50)mIU 的实例分割结果。对于相对较小的遥感数据集,浅层网络也可以获得和较深层的网络相似的结果,但节省了更多的时间。该模型从自然图像领域延伸到高分辨率光学遥感影像领域,表现出了相当好的通用性。而且,目标检测与较难的实例分割结果之间只有很小的差距。额外测试的影像和深圳高分辨率影像的进一步可视化显示出极佳的结果。该模型显示出对不同路面,不同尺度,不同形状,多个方向和影像形变的鲁棒性。在建筑物检测和分割任务中,该模型达到了 0.797(ResNet101)mAP目标检测结果和0.695(ResNet101)mIU实例分割结果,实现了相当好的性能。此外,在不同密度的住宅数据集中测试的结果显示,在稀疏和中等密度住宅影像上表现出相对良好的结果,但在密集住宅影像上表现不佳。