论文部分内容阅读
在最近几十年中人工智能领域获得了长足的发展,图像识别作为人工智能领域的最为重要应用之一逐渐深入各种生活场景,给人们的日常生活带来了极大的便利。基于字典学习的分类算法是图像识别方法中备受关注的研究方向之一。字典学习是一种重要的表达学习方法。在早先很多关于字典学习的研究中,研究者们借助字典学习所具有的生成模型的属性,利用过完备字典以及图像在其上的稀疏表达系数进行图像重建。然而,字典学习模型中的稀疏表达系数与对应的字典项同样也是优秀的特征,因此基于字典学习的图像分类算法逐渐获得了研究者们的关注。基于字典学习的图像分类算法依赖于具有优秀结构的字典,模型中字典需要保留数据集中最具代表性且最为关键的信息。此外,现有的基于字典学习的分类方法受限于传统字典学习低下的计算效率而难以应付许多实际应用场景。本文提出了一种新颖的判别字典学习网络框架,利用生成字典学习模型与神经网络模型协同学习一个具有特殊结构的字典,该字典同时捕获判别性信息与重构细节所需的描述性信息。判别性字典学习网络模型非常灵活,在快速推断测试样本标签的同时可以加速求解稀疏编码过程。更为重要的是,学得的字典剥离了图片细节信息与判别性信息,这使得判别字典学习网络在图像分类任务中具有出色的性能并且较之于传统的基于字典学习分类方法更为高效。此外,本文还分析了在现实环境中尤其是人脸识别任务中普遍存在的已知类别未知模式问题,针对该问题基于判别字典学习网络设计了拟梦境训练方法,提高判别字典学习网络针对训练样本不足或者存在缺失的情况的鲁棒性。本文的贡献可以概括为如下几点:1.提出新颖的判别字典学习网络框架,该框架为传统基于字典学习的分类方法协同训练一个预测神经网络,将基于字典学习的分类方法完全参数化,提高计算效率。2.提出的模型框架中设计了一种新颖的判别字典结构,包含标签子字典与描述子字典,将细节描述性信息剥离与本质特征分开存放,使得字典具有更加良好的解释性。该结构将类别标签直接嵌入稀疏编码,分类过程因此无需额外的分类器或额外的重构计算。3.针对提出的判别字典学习网络模型框架分别给出了基于L0范数约束与L1范数约束的两种不同的实现。4.阐述并分析了已知类别未知模式问题,针对该问题提出基于判别字典学习网络的拟梦境算法,并结合判别字典学习网络的两种模型给出了具体实现,通过拟梦境算法生成虚拟样本训练预测神经网络提高了图像分类的鲁棒性。