论文部分内容阅读
字典学习是机器学习和模式识别领域的一个重要研究方向,同时也是表示学习领域的一个重要方法,其主要通过学习得到字典原子以便数据可以被这些原子稀疏表示。基于字典学习的分类和识别方法在很多应用中取得了很好的效果。本文立足多层字典学习框架,主要研究如何增强多层字典学习方法的判别性以及在特定识别问题中的应用,取得的研究成果如下:针对多层字典学习没有利用数据的标签信息以至于学习到的表示系数判别性不强,提出了一种基于回归误差的判别多层字典学习方法(RE-DMDL)。通过引入回归误差项,使得RE-DMDL在考虑重构能力的同时,增强了表示系数的判别能力。同时通过一个非负的松弛变量来进一步增大“标签距离”,从而使得算法更加适用于分类问题,提高了其在分类任务上的准确率;此外将表示系数的约束改为L2范数,也减少了算法训练的时间开销。实验结果表明RE-DMDL较之传统方法可以很好地提高多层字典学习在分类任务上的分类准确率。继而,本文从图约束的角度考虑如何增强多层字典学习表示系数的判别性,提出了基于标签图约束的多层字典学习方法(LGC-MDL)。通过构造标签图,在优化重构误差的同时,使得同类样本的表示系数之间的距离最小化,不同类样本之间的距离最大化,从而增强表示系数的判别性。通过实验验证了所提的LGCMDL可以进一步提高多层字典学习在分类任务上的分类准确率。针对投影孪生支持向量机对噪声和野值点较为敏感,同时没有考虑数据的局部流形结构的问题,提出了基于全局和局部信息的模糊投影孪生支持向量(FGLPTSVM)。通过引入模糊隶属度的思想,不同的样本点根据其属于某一类的置信度分配一个模糊隶属度,减少了噪声和野值点对算法的影响;同时通过构造一个全局和局部约束图,使得数据的局部流形信息得以很好地保持。实验结果表明所提算法可以减少噪声和野值点对模型的影响,提高分类准确率。雷达辐射源个体识别是敌我识别、威胁警告等系统均要解决的一个关键问题。将本文所提RE-DMDL算法和LGC-MDL算法应用于雷达辐射源的个体识别中,实验结果表明这两个算法能够很好地提高雷达辐射源识别系统的分类准确率,具有工程应用价值。