论文部分内容阅读
近年来,以深度学习为代表的图像识别技术已经取得了许多突破性进展,但是,当面临非理想训练集时,现有图像识别算法和模型的性能将会受到较大影响。本文主要针对样本标签缺损、训练类别缺损以及样本标签含噪这三种非理想训练条件,分别从多标签学习、零样本学习和噪声鲁棒学习三个角度研究相应的图像识别方法,以提升分类模型的泛化能力。具体研究工作包括以下几个方面:针对样本标签缺损问题,现有基于多标签分类的方法容易忽略标签语义与图像特征之间的深层次关联关系;而另一种基于概率学习的方法则缺乏对先验标注信息的有效利用。为此,本文提出了基于精确约束矩阵填充的多标签学习方法,将图像多标签学习任务形式化为图像标签矩阵的优化问题,并且在优化问题中引入标签约束来尽可能精确地保持初始的正确标注信息,同时将最小化图像视觉特征与标签语义信息之间关联关系的差异作为优化目标,并通过线性交替方向法来有效求解该优化问题。最后,分别通过图像标注和图像检索任务验证了本文方法的有效性。针对训练类别缺损问题,目前有很多方法通过基于嵌入空间的零样本学习方法解决,其一般思想是将图像视觉特征和类别语义特征映射到一个共有的嵌入空间中,然后通过最近邻法则完成测试集中新类别样本的识别。领域偏移(domain shift)和枢纽点(hubness)问题是此类方法固有的缺陷,大多数已有工作都通过在映射函数的学习过程中引入L1范数或L2范数约束来缓解这些问题,但L1范数的稀疏估计特性可能会造成对数据集的欠拟合,而L2范数则可能为嵌入空间的学习带来较大偏差。为此,本文结合弹性网络和线性鉴别分析的优点而提出了一种新型的混合正则方法,该方法能够同时保留类间结构在嵌入空间中的一致性和区分性,从而同时缓和领域偏移和枢纽点问题;同时设计了一种有效的异步优化求解策略而得到最优映射函数。本文通过多种标准图像数据集对所提方法进行了验证,实验结果表明本文方法优于单一的正则化方法以及多种已有方法。针对样本标签含噪问题,现有的深度神经网络(DNN)损失函数难以具备噪声鲁棒性,或是仅对某些特定的噪声类型具有一定的容忍度。为此,本文首先对传统的交叉熵损失函数进行改进,提出了一种新型的修正交叉熵损失,它能够通过引入加权系数来引导DNN更加关注于正确标注的样本,本文在数学上证明了该损失函数对标签噪声的鲁棒性;在此基础上,受课程学习(curriculum learning)思想和多视角学习(multi-view learning)机制的启发,本文提出了深度神经网络的交叉训练架构,利用两个相互协同的DNN模型互相给对方提供关于样本含噪概率的反馈信息,同时更新自身网络参数;在此架构下,本文进一步设计了一种在线数据清洗机制,使得能够在产生噪声鲁棒DNN模型的同时自动净化训练数据集。本文在多种标准图像数据集上进行了充分的实验,验证了所提方法能够对不同的噪声类型和噪声规模具有鲁棒性。