论文部分内容阅读
随着软硬件技术的飞速发展和大数据时代的到来,深度学习技术在越来越多的领域中取得了突破性成果。而其中的卷积神经网络受生物视觉系统启发,将深度学习思想引入到神经网络之中,依靠自身具备的局部感受野、参数共享、降采样和稀疏连接等特点,近年来已成为计算机视觉领域和人工智能领域中相对活跃的研究方向。本文结合图像的自身特点,在卷积神经网络理论的基础上,论述了用于图像分类识别任务的卷积神经网络模型的构造方法、迁移训练、优化算法和分类识别性能,其主要的工作内容如下:(1)多数识别方法常将图像识别任务分割为特征提取和分类识别两个阶段,识别过程中往往涉及到繁杂的图像预处理和人工标记特征设计,考虑到需要充分保留图像的原始特征信息,利用卷积神经网络构建了一个11层端到端的图像分类识别模型。该识别模型可以从原始图像中进行特征自学习,设计的分层结构将传统方法中的特征提取和分类识别两个阶段串联融合在一起,可以进行端到端的分类识别。最后将该模型应用到自然场景下的车牌字符识别任务上,对比实验验证了该卷积模型集特征自学习和高效分类识别于一体的应用性能。(2)针对深度卷积网络训练过程中常出现的过拟合问题,构造了若干个具有不同特征提取层的深度卷积模型,分析讨论了图像数据增强变换、卷积核的尺寸、梯度下降训练优化算法以及Dropout丢弃层等模型调参方法对过拟合问题的影响,在不同参数的模型训练损失对比实验上,验证了最优识别模型的抗过拟合性。(3)针对训练数据不足的小样本量图像识别问题,提出了基于卷积神经网络的迁移学习方法。借助大规模数据集上的预训练模型,根据源数据域与目标数据域数据内容的差异,将源数据域中的预训练模型分别迁移到域内同构和域间异构的小规模图像数据集上,冻结不同层的训练参数,微调整个网络,并在部分小样本量的公共数据集和自建小规模车牌字符数据集上验证了提出方法的实验效果。