论文部分内容阅读
行人检测是物体检测领域中比较重要的子课题。在新兴应用中,无论是视频或图像,因为距离问题使行人的像素非常小,因此常规行人检测方法很难检测出这类小目标行人,而基于深度学习模型的检测效果也不理想。除此以外,因为摄像机的移动,场景的相似颜色融合,光线不足或阴影干扰等因素,都会对小目标行人检测造成一定困难。如今,利用深度学习技术对行人检测的效果要远远好于传统的机器学习方法或其他图像处理方法,且有很多行人数据集用于测试检测的效果。随着研究的深入,已经解决了一部分类似图像光照、变形、遮挡等因素影响的问题,但小目标行人检测问题依旧是难点。基于此问题,本文采用了改进的卷积神经网络方法对小目标行人进行了检测研究,主要研究内容包括:1.研究了近年来比较重要的基于卷积神经网络进行行人检测的模型,主要研究了两类模型,一是基于候选区域提取的模型,如RCNN,Fast-RCNN和Faster-RCNN,二是基于整体图像回归的模型,如YOLO和SSD。通过对这些卷积神经网络模型各方面的对比,并使用Faster-RCNN,YOLO和SSD模型对图像中一般像素大小的行人进行检测,最后分析检测效果,从而说明了采用YOLO模型作为基础模型加以改进的合理性。2.在YOLO模型基础上,提出了一种改进的卷积神经网络模型YOLO-K,改进方法是在该模型的特征提取层之前增加新的克罗内克上采样层和分块区域提取层,然后修改了模型检测端部分的相关参数。使用无人机自主采集了实验的图像数据,对数据集中的小目标行人进行检测。实验采用改进的卷积神经网络模型YOLO-K,YOLO模型和SSD模型,分别对无人机高空航拍图像上的行人目标进行检测,采用误检率和漏检率作为对比的指标,结果表明本文的改进模型能够有效的检测到较小目标行人,尤其在召回率上有了很大提升。