论文部分内容阅读
图像分类作为机器学习以及计算机视觉方面基本研究问题,在目前的图像处理等研究领域里逐渐成为了越来越重要的研究方向。在互联网与物联网迅速发展的时代,信息技术的快速发展带来了越来越多的便利和进步,如何来有效率的组织、检索以及分辨这网络中海量的图像数据成为一个非常重要和关键的问题。所以目前能够解决好这个问题的一个非常重要且关键的方法就是图像分类,所以对图像分类进行深入的研究不仅具有非常好的实用价值,而且有着很深入的理论意义。经过多年许多研究学者的深入研究,多种图像分类的算法被相继提出。在目前的图像分类技术中,度量学习扮演着十分重要的角色。度量学习在目前机器学习和计算机视觉领域内作为一个重要的研究领域得到了越来越多研究学者的关注。本文在基于度量学习的基础上进行图像分类,本文的主要工作有:(1)本文将需要进行探讨的基于度量学习的图像分类研究方向的研究现状及其意义进行了描述。并且研究了马氏度量学习及其在两个准则下的学习方法以及基于马氏度量学习的几种图像分类方法。(2)提出了基于椭圆马氏度量学习的图像分类算法。本文中椭圆马氏度量学习的问题即针对给定的训练样本数据,通过训练学习到一种能够反应出样本空间结构的信息或者其语义信息的分式线性变换方法,由此令本文的椭圆马氏度量学习方法产生更好的区分性。已知线性变换属于分式线性变换的一种特殊形式,由此基于椭圆马氏度量学习的方法适用的范围更加广泛。本文基于椭圆马氏度量学习的图像分类算法有着更好的分类效果,首先进行图像特征提取,本文通过提取颜色特征以及局部二值模式(Local Binary Patterns,LBPs)纹理特征,通过将颜色特征与纹理特征相结合构建本文的图像特征;然后计算初始椭圆马氏度量矩阵,根据样本数据的统计特性从而定义出椭圆马氏度量,接着采用椭圆马氏度量学习从而获得最优化的椭圆马氏度量矩阵;最后采用学习好的椭圆马氏度量计算出图像特征之间的距离并进行图像的分类。(3)提出了基于二次判别分析的椭圆度量学习图像分类算法。针对图像分类中度量这一关键问题,本文基于椭圆度量学习的图像分类算法首先提取图像的颜色直方图和比例尺度不变的局部三值模式(Scale Invariant Local Ternary Patterns,SILTP)直方图,然后将其经过局部最大发生处理获得有效的图像特征表示。接着引入椭圆度量,通过对类内差异和类间差异进行高斯分布建模,构建二次判别分析(Quadratic Discriminant Analysis,QDA)模型,从而根据两个模型的对数似然比来定义椭圆度量矩阵;为了保持最大化的分类信息,采用有监督的线性判别分析法进行降维生成新的特征子空间,同时学习最优椭圆度量矩阵;最后利用椭圆度量计算图像特征间的距离从而完成分类。本文在VIPeR,QMULGRID和CUHK03这三个数据集上进行实验,实验表明该算法提高了图像分类的性能。