论文部分内容阅读
图像分类能够有效地管理和组织图像,为图像处理的多个领域的工作奠定良好的基础。伴随互联网技术和社交网络的兴起,数字图像数量上急剧增加应用也越来越多,人们在情感和信息表达的时候也更多采用直观的图片来代替文字。大量的数字图像需要管理、分析、检索,这迫切需要效率更高、更准确的图像分类技术。深度学习是对传统神经网络进行扩展的一种学习方法,模拟人脑认知逐步抽象的过程,加深了隐含层数量,可以自动学习特征。卷积神经网络(Convolutional Neural Networks)是深度学习结构中在图像分类领域里应用最多、成绩最突出的一种,与传统的浅层学习算法相比,在图像分类效果上有显著的提升,因而受到了广泛关注。 深度学习模型虽然在图像分类领域取得令人瞩目的分类效果,但一直无法用数学理论来证明其问题求解过程,这使得研究局限于通过实验来调整模型结构和参数,从而设计出更为有效的模型。除了对模型本身的研究,深度学习与其它的机器学习方法的融合,引入其他方法的优点解决相应的问题也是研究的一个热点。本文介绍了卷积神经网络的应用与研究热点,引入迁移学习、支持向量机、多尺度空间模型、模糊分类等方法与卷积神经网络模型融合,着重研究模型结构和参数设计,以获得在具体图像分类问题中更准确、有效的结果。具体内容如下: (1)针对小样本图像分类问题,将图像小样本分类应用于小范围的图像定位。结合问题特点设计了一种基于迁移学习的混合CNN结构(TCNN-SVM),通过迁移学习使得小型数据库可以在利用大型数据库训练所得到的更有区分度和鲁棒性更高的特征,并且利用特征迁移通过固定特征抽取部分参数,重新训练分类器部分参数适应新的数据集,在一定程度上降低了训练的时间成本和训练复杂度。混合模型中引入了支持向量机作为分类器,避免由于样本类别数过少导致全连接层间神经单元数量陡降的问题。同时采用了符合场景识别定位的小样本数据扩增技术,通过切割和小角度旋转,使得采集的样本数不需要太多也能获得比较好的分类效果。 (2)针对精细图像分类问题,主要研究电商平台中女装商品的精细分类。借鉴空间金字塔模型的思想提出基于多尺度异构CNN的学习模型(MHI-CNN)。与单个CNN的结构相比,采用异构的CNN结构学习到的特征差异性更大,能够更为有效地解决精细分类问题中特征差异化的问题。设计多尺度的输入,避免了CNN结构输入维数固定的问题,这使得输入图像不会因为单一的切割而损失重要信息。采用投票机制计算权值来混合多个CNN结构,避免使用平均的方式弱化区分性能强的CNN结构。同时将前景分割、颜色通道变化作为一种数据扩增的手段。前景分割在精细分类中通常是作为预处理手段,实践表明,其对分类结果有明显的提升作用,但也会带来部分信息损失。这些信息在某些情况下可能是很重要的。而作为CNN数据扩增的方式,既增加了样本的数量更符合CNN训练要求,同时保留了背景中有价值的信息。 (3)针对低质量图像和难分辨图像分类问题,主要研究电商平台中买家秀中的低质量和难分辨图像的分类管理。借鉴人工处理低质量图像的思路,提出了一个基于模糊分类的卷积神经网络模型。采用CNN模型,没有预先对图像做增强或者是超分辨率重建的操作,减少了计算的时间复杂度。在分类过程中,引入了模糊隶属度的概念,对每个分类先通过卷积神经网络的特征提取获得类模板,计算与类模板的贴近度,最后输出一个类别标签的模糊度。这样解决了低质量和难分类图像的分类结果硬性判定的问题。 以上所提出的方法的有效性都在相应的数据库上进行了实验验证,实验结果表明,上述所提方法是有效的。 最后,在总结全文的基础上,提出了有待进一步研究的课题和今后工作的重点。