论文部分内容阅读
随着城市化的快速发展,建筑物的布局规划对城市的发展变得尤为重要。早期的城市分析采用遥感图像,但提供的信息不够全面。与遥感数据提供的俯视信息相比,街景图像中含有更多角度场景信息,更为直观的反映了建筑物细节特征。建筑物检测和分类可以有效提升城市区域评价的效率和准确率,有效的扩大评价范围,研究成果将为城市精细化管理和城市设计提供数据支撑。通过对包含建筑物的数据集调研发现,目前用于图像分类的街景建筑数据集较少,BIC_GSV是其中一个比较完善的数据集,通过观察发现,该数据集主要存在两方面问题:一方面对于一幅图像中包含多个建筑物的情况,只使用了一个类别标签,不能精确地描述每一类的类别信息;另一方面,一些图片可能由于标注者的主观原因使得标签不够准确,不能很好地对建筑物进行分类。另外,建筑物多标签检测分类任务还没有合适的方法。针对以上问题,本文的研究内容如下:(1)针对BIC_GSV数据集中单标签和标签不准确问题,对BIC_GSV数据集中的图像中的主要建筑物进行筛选,对符合要求的图像标出边界框,协同专家共同确定建筑物类别,利用Lable Img软件进行标定,建立了标定的BDISV1.0多标签街景建筑物数据集。(2)针对本文训练样本差异性较大,样本不均衡,不能再采用精确度,召回率,F1分数进行评价的问题。本文在采用VOC 2007平均精度均值(m AP)评价的基础上,提出了平均查全率均值(m AR)、平均F1分数均值(m AF1)两个评价指标对本文实验结果进行评价。(3)针对建立的数据集,提出采用基于卷积神经网络(CNN)的多分类检测器(SSD)方法进行建筑物检测和分类。实验结果表明该方法与原数据集的单标签分类比较来看可以较有效地进行建筑物检测和分类,而且在一定程度上避免了一幅图像上多个建筑物混淆的情况。但是对遮挡相对严重,甚至一个建筑物被分成几部分,只有局部可以观测到的情况,目标框占比较小,会导致检测失败的问题,本文一方面降低了目标框占比阈值,提升遮挡情况的检测分类效果;另一方面,考虑到由于一幅图像中建筑物距离较近,可以完全不考虑建筑物在图片中的位置信息,问题转化为多标签分类问题,很大程度地提升了建筑物的分类效果。(4)由于Gabor变换可以有效的增强纹理特征,提出了基于环形对称Gabor变换的样本增强方法。尽管采用的迁移网络已在空域进行了数据增强,但由于不同类别建筑物的纹理信息差别明显,本文通过环形对称Gabor变换在变换域进行数据扩充。实验结果表明,该方法可以在一定程度上提高建筑物检测分类的精度。