小规模数据集图像分类方法研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:xiao137wu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前图像分类任务在CIFAR-10、CIFAR-100和ImageNet等大型通用数据集上获得最优表现的均是基于深度卷积神经网络的方法,但深度卷积神经网络依赖大量已标注的训练样本来优化,因此在一些已标注样本数量不充分的小规模数据集上主要存在两个问题:一是深度卷积神经网络模型在这些数据集上的训练比较困难或者效果不佳;二是在一些需要精细分类的特定领域小规模数据集上,由于样本之间相似度较高,容易产生误分类问题。针对第一个问题,本文使用了一种在小规模图像数据集上表现要优于卷积神经网络的新型网络模型——胶囊网络,将其作为小规模图像数据集Caltech-256和Oxford Flower-102图像分类任务中的基础网络,并且将优化正则项参数的核FCM聚类算法结合到胶囊网络中,作为原先胶囊网络中聚类算法的替代,改进了原生胶囊网络中的动态路由过程。对比实验结果显式胶囊网络相比本文的基线CNN模型在Caltech-256数据集上有4%左右的提升,在去除了背景干扰的Oxford-102数据集上有2%左右的提升。本文的胶囊网络模型相比原来的胶囊网络0.2%左右的提升,实验结果说明了胶囊网络在这两个小规模图像数据集上相比深度卷积神经网络的优势,也表明了本文提出的胶囊网络模型的有效性。针对第二个问题,本文提出了基于迁移学习的两级特征融合学习方法。利用在样本数量充足的大型通用图像数据集上已预训练完毕的深度卷积神经网络模型,将其应用Caltech-256和Oxford Flower-102数据集上,通过修改最终目标函数对网络参数进行微调来进一步学习到源域数据和目标域数据共同的特征表示,完成一级通用特征提取。由于小规模图像数据集中的大部分分类错误都产生在相似度较高的图像类别之间,本文基于精细分类的思想,通过谱聚类将高相似度样本分成特殊训练子集,通过进一步在预训练完毕的模型上微调网络参数,完成二级特殊特征提取,最后将一级通用特征和二级特殊特征进行融合后输送到分类器完成最终的模型训练。对比实验结果显示使用了两级特征融合学习的模型相比没有使用的要高出0.73%~0.86%,证明了本文的两级特征融合学习方法能有效减少误分类问题,缓解了在哪些需要精细分类的小规模图像数据集上易发生的误分类现象,提高了图像分类任务的精度。
其他文献
当前是我国经济面临着转型升级的关键时期,国内供给侧结构性改革蓬勃展开,国际上要应对美国的贸易战。为了国内经济成功转型以及应对一系列国际挑战,此时对技术创新对产业结构的影响进行更深入的研究非常有意义。总体上技术创新资金投入主要是试验发展的资金投入和企业资金对二三产业的产值结构有正向的促进作用,即能显著地相对提高第二产业的产值比例。应用研究和试验发展的人力投入都对二三产业的就业之比有显著影响,但应用研
随着无线通信技术的飞速发展,卫星通信技术在社会的各个领域得到了广泛的应用。卫星通信是地面通信的重要补充和延伸,可以在海洋、沙漠等无法建造地面基站的地区提供通信服务。但是面对日益复杂的电磁空间坏境、对通信卫星有意无意的干扰问题,如何快速准确的对干扰源进行定位显得尤为重要。首先,本文对卫星通信系统中基于时差和频差联合的无源被动定位技术及系统进行综述,分析了无源被动定位技术的研究背景和意义,同时对无源被
随着社交平台的日益普及,微博因其文字短小、传播速度快受到了广大网友的喜爱,微博文本中蕴含的海量信息也从商业、政治、娱乐等不同方面带来了巨大价值,从而引发了学者们对
在大数据时代,用户的隐私保护是一个关键问题。作为数据挖掘的经典算法,原始k-means算法常用于对明文数据进行聚类分析,没有考虑到隐私保护的问题。已有工作研究支持隐私保护的k-means算法,但是一般有计算成本高(例如加密算法),精度损失大(例如数据扰动方法),通讯成本高(例如安全多方计算)等缺点。负数据库作为一种新型的数据表示方法,存储的是原始数据库补集中的信息,其难以逆转的特性可以用于保护原始
随着社会经济的快速发展,人们日常生活中的决策活动越来越复杂。因决策环境信息的不确定性和人类认知的模糊性,现有决策活动往往存在着不确定性信息,属于模糊决策问题。区间
随着互联网与智能制造的深度结合,计算机虚拟现实技术得以快速发展,碰撞检测技术作为虚拟现实技术中的重要环节,对智能制造生成效率和质量提高有着重要作用。五轴数控加工作为智能制造产品的重要加工手段,广泛应用于航空航天、汽车、船舶零部件生产领域中,在加工过程中由于增加两个旋转轴,提高灵活性的同时使得加工过程更加复杂难以预测从而引起数控系统干涉碰撞,影响零件加工效率和质量。目前国内外学者对碰撞检测进行大量研
生物活性分子,如抗坏血酸(AA)、氧化型谷胱甘肽(GSSG)和碱性磷酸酯酶(ALP),广泛的存在血清和中枢神经系统中,在人类新陈代谢过程中发挥着重要的作用。谷胱甘肽(GSH),是一种由
近年来,我国油气勘探的重心已经逐渐由常规储层转入深层、超深层储层领域。这类储层钻遇探井较少,井中资料比较稀缺,缺乏基础的岩石物理数据。本文以阿克苏地区塔里木盆地的
19世纪初期,为了解决国内的自由黑人问题,一批政治家们成立了美国殖民协会(American Colonization Society)。它的目标是执行海外殖民计划——将美国的自由黑人运输到非洲大陆。美国殖民协会成立后,就开始谋求联邦政府的资助并且采取了多种措施来获取民众的支持。到1820年代末30年代初,海外殖民事业已取得了长足的进步。与此同时,1820年代末、1830年代也是奴隶制问题开始发酵并
学术研究和数字图书馆的快速发展导致网络上学术论文急剧增多,如何为学者们提供个性化的论文推荐服务成为了数据挖掘领域的研究热点。本文基于深度学习技术从增强论文和用户