论文部分内容阅读
物体检测技术旨在识别并定位图像中的物体,是机器视觉领域中的一个核心研究问题,同时也是人工智能的一个重要组成部分,一直是学术界和工业界的重点研究课题之一。虽然经过了几十年的发展,目前的物体检测算法大多仅是在实验室摆拍图像上的检测效果表现良好,但是在复杂世界的真实场景中,需要依赖有标注信息的图像来训练一个物体检测网络,其检测效果远远不能令人满意。同时,对于真实场景下的小物体(面积小于32*32像素)检测问题,尚处于对特定问题设计特定算法的阶段,对真实场景下复杂多变的工作环境的自适应能力较差。针对上述问题,本文围绕稀缺/稀疏训练数据驱动下的物体检测算法、小物体特征提取方法以及小物体检测算法框架等方面展开研究,对如何提高物体检测算法对环境的自适应能力、灵活性以及如何提高物体检测的准确性提出了新的方法和建议,对物体检测技术从实验室到实际应用起到了一定的推动作用。本文的主要研究内容概括如下:
(1)针对已有基于深度卷积神经网络的物体检测算法都依赖大型数据集训练检测网络的问题,而构建大型数据集是一个费时耗力的巨型工程,提出了一种基于伪真值搜寻法的弱监督物体检测算法。其中,针对现存相关算法存在的定位不准确、检测精度低的问题,提出了一种从弱监督到全监督的物体检测架构,其中伪真值搜索(PGE)算法可以为每个物体产生一个较为准确的伪真值边界框。同时,还提出了伪真值自适应(PGA)算法来进一步优化PGE所产生的伪真值。最后,利用产生的准确的伪真值训练一个物体检测网络,来实现真实场景的物体检测任务。实验结果表明,本文提出的算法可以克服实际应用中训练数据稀缺的问题,同当前先进算法相比可以大幅地提高物体检测的准确率。
(2)针对弱监督物体检测算法与全监督物体检测算法相比存在检测效果较差的问题,提出了一种基于增量式学习法的丢失标签物体检测算法。首先,研究了训练图像中丢失标签对于一般物体检测算法的影响,在此基础上,对在有限的人力物力下如何构建一个大型的数据集给出了具体方案。其次,通过引入人为标注小部分训练数据的方法来提升弱监督物体检测的准确率,且把此任务看成一个丢失标签的物体检测问题。然后,利用所提出的增量式学习框架为丢失标签的物体由粗略到精确逐步地找到一个位置标签,进而结合少部分人为标注的位置标签来训练一个物体检测网络。实验结果表明,本文提出的算法可以利用小部分的标注信息就可以达到较高的物体检测准确率,缩小了与全监督型物体检测算法之间的差距,解决了稀疏数据驱动下的物体检测问题。
(3)针对目前的卷积神经网络对小物体特征提取困难的问题,提出了一种新的基于多通道高分辨率特征提取法的真实场景多尺度物体检测算法。该算法中所设计的并行卷积层结构可以提取小物体的高分辨率深度特征,其中包含了可以表达小物体各种特性的细节信息特征,克服了现存算法利用浅层特征来实现小物体检测中存在的低语义信息问题。为了进一步地实现多尺度物体检测任务,提出了一种层级间特征融合方法,通过将富含细节信息的高分辨率特征与具有强语义信息的低分辨率特征相融合的方式来构建高质量特征,进而在获得的高质量特征上实现多尺度物体检测。实验结果表明,本文所提出的算法能够更好地适应真实场景下物体的多尺度特点,可以提高小物体检测的准确率。
(4)针对已有的物体检测算法不能解决小物体自身细节信息不足情况下的物体检测问题,也不能解决遮挡、光照、模糊等自然因素对小物体检测的影响,提出了一种新颖的端到端的基于生成对抗网络的小物体检测架构。该算法首次将超分辨技术成功地应用到小物体检测任务中,首先利用生成对抗网络(GAN)来学习产生低分辨率物体图像对应的高分辨率图像,然后在清晰的高分辨率图像上实现物体检测任务。进一步地,为了促使网络产生更为清晰的超分辨率图像,设计了几种新的损失函数。实验结果表明,本文所提出的小物体检测架构可以克服小物体自身细节信息不足而带来的检测困难的问题,降低了真实场景下的物体检测算法受自然因素的影响,提高了真实场景下小物体检测的准确率。
(1)针对已有基于深度卷积神经网络的物体检测算法都依赖大型数据集训练检测网络的问题,而构建大型数据集是一个费时耗力的巨型工程,提出了一种基于伪真值搜寻法的弱监督物体检测算法。其中,针对现存相关算法存在的定位不准确、检测精度低的问题,提出了一种从弱监督到全监督的物体检测架构,其中伪真值搜索(PGE)算法可以为每个物体产生一个较为准确的伪真值边界框。同时,还提出了伪真值自适应(PGA)算法来进一步优化PGE所产生的伪真值。最后,利用产生的准确的伪真值训练一个物体检测网络,来实现真实场景的物体检测任务。实验结果表明,本文提出的算法可以克服实际应用中训练数据稀缺的问题,同当前先进算法相比可以大幅地提高物体检测的准确率。
(2)针对弱监督物体检测算法与全监督物体检测算法相比存在检测效果较差的问题,提出了一种基于增量式学习法的丢失标签物体检测算法。首先,研究了训练图像中丢失标签对于一般物体检测算法的影响,在此基础上,对在有限的人力物力下如何构建一个大型的数据集给出了具体方案。其次,通过引入人为标注小部分训练数据的方法来提升弱监督物体检测的准确率,且把此任务看成一个丢失标签的物体检测问题。然后,利用所提出的增量式学习框架为丢失标签的物体由粗略到精确逐步地找到一个位置标签,进而结合少部分人为标注的位置标签来训练一个物体检测网络。实验结果表明,本文提出的算法可以利用小部分的标注信息就可以达到较高的物体检测准确率,缩小了与全监督型物体检测算法之间的差距,解决了稀疏数据驱动下的物体检测问题。
(3)针对目前的卷积神经网络对小物体特征提取困难的问题,提出了一种新的基于多通道高分辨率特征提取法的真实场景多尺度物体检测算法。该算法中所设计的并行卷积层结构可以提取小物体的高分辨率深度特征,其中包含了可以表达小物体各种特性的细节信息特征,克服了现存算法利用浅层特征来实现小物体检测中存在的低语义信息问题。为了进一步地实现多尺度物体检测任务,提出了一种层级间特征融合方法,通过将富含细节信息的高分辨率特征与具有强语义信息的低分辨率特征相融合的方式来构建高质量特征,进而在获得的高质量特征上实现多尺度物体检测。实验结果表明,本文所提出的算法能够更好地适应真实场景下物体的多尺度特点,可以提高小物体检测的准确率。
(4)针对已有的物体检测算法不能解决小物体自身细节信息不足情况下的物体检测问题,也不能解决遮挡、光照、模糊等自然因素对小物体检测的影响,提出了一种新颖的端到端的基于生成对抗网络的小物体检测架构。该算法首次将超分辨技术成功地应用到小物体检测任务中,首先利用生成对抗网络(GAN)来学习产生低分辨率物体图像对应的高分辨率图像,然后在清晰的高分辨率图像上实现物体检测任务。进一步地,为了促使网络产生更为清晰的超分辨率图像,设计了几种新的损失函数。实验结果表明,本文所提出的小物体检测架构可以克服小物体自身细节信息不足而带来的检测困难的问题,降低了真实场景下的物体检测算法受自然因素的影响,提高了真实场景下小物体检测的准确率。