论文部分内容阅读
目标检测就是利用数字图像的相关技术获取图像或视频序列中特定目标的几何特征以及统计特性等信息,实现对目标的分割和提取。随着现有无人机技术不断取得突破性进展,国内的无人机市场也将迎来爆发式的增长。对于国家军事应用来说,无人机目前已经成为了一种新型空中支援力量,然而目标检测又是其中的一项关键技术。同样伴随着计算机科学技术的迅猛发展和数字图像处理技术在各个领域的广泛应用,利用数字图像处理技术对无人机获取的图像中感兴趣目标进行实时、高效的检测也逐渐成为许多高校、研究机构的热门方向。对特定目标进行动态、实时以及稳定的检测和定位在现代交通管理、小区监控、校园安保、国家军事应用以及医学辅助导航手术等方面具有广泛的实际应用价值。但是无人机机载系统智能化处理能力明显不足,比如:实时动态目标检测、跟踪以及定位。因此研究高效率、高精度的无人机目标检测算法具有重要的理论意义和工程应用价值。针对以上问题,本文针对行人目标遮挡处理、形变以及小目标检测提出新的解决方案,提出了基于预处理和目标优先定位相结合的卷积神经网络目标检测算法;利用NVIDIA的Jetson TX1的高性能处理器结合GPU加速,保证了基于卷积神经网络的无人机目标检测算法的流畅实时运行。首先从目标检测的基本理论开始研究,分析目前检测算法中的特征提取,遮挡处理的研究现状,总结出现的难以解决的问题和难点。面对以上问题本文使用(Convolutional Neural Network,CNN)卷积神经网络作为基础研究工具,提出了基于卷积神经网络的无人机目标检测算法及其系统实现。为此,本文的研究工作主要从下面两个方面展开:(1)首先深入研究了卷积神经网络的理论和方法,将原来需要提取大量数据集特征的算法进行改进。从整幅图片的特征区域入手,采用端到端的学习算法,结合YOLO的神经网络架构,搭建改进后的基于行人目标检测的网络层,进而提高目标检测的精度和效率。针对前期输入图像的预处理过程,首先将采集到的图像进行颜色空间转换以及归一化处理,采用(Histogram of Oriented Gradient,HOG)梯度算子得到关于行人的特征图,最后利用BING算法过滤掉图像的背景信息,最终输入到卷积层的二值化图像,只保留检测目标的特征信息和部分背景图轮廓。网络层借鉴了Fater R-CNN的anchor思想,直接在输出特征图上进行预选框的预测。使用anchor boxes来预测边界框。主要采用k-means聚类自动求取预选框。输出后的检测部分采用改进方法将预测框的置信度和IoU结合,当预选框出现多个相交时,具有较低置信度的值不会被直接从重叠框中删除。通过前期训练得出一个符合行人目标特征的最佳阈值,再次进行比较确定是否保留。实验表明,该算法在弱小目标以及前景遮挡等特征数据量较小的场景下具有优异的性能。(2)为了检验和验证本文所提出的算法的准确性和稳定性,首先,在PC机上进行线下训练,得到稳定的权值以及整体测试框架。对本文的提出的模型与多种现有主流目标检测方法,如HOG+SVM、haar-like+Adaboost以及YOLO等做对比实验。本文将通过仿真验证实验,从抗干扰性、抗遮挡性、稳定性、实时性和精度等方面进行验证和分析,并给出分析结果。最后将算法框架移植搭载到TX1的处理器进行系统测试,和无人机进行实时的远程交互。处理器将作为无人机的计算处理中心,使得无人机彻底摆脱计算能力不足的限制。从而实现一个能应用于实际环境中的基于无人机的自动、高效、快速的行人目标检测系统。