【摘 要】
:
细粒度图像分类是对隶属于同一种大类、但子类别有细微差异的图像进行分类。例如,鸟类数据集里的图像均属于鸟类,但是子类别不同,需要按照子类别进行识别。与传统图像分类任务相比,细粒度图像分类更加具有挑战性,主要原因是细粒度图像具有类间差异小和类内差异大的特点,导致必须借助具有细微差异的局部区域才能分辨出不同的子类别。因此,细粒度图像分类的关键在于准确的部件定位算法,只有得到准确的部件区域,才能提高细粒度
论文部分内容阅读
细粒度图像分类是对隶属于同一种大类、但子类别有细微差异的图像进行分类。例如,鸟类数据集里的图像均属于鸟类,但是子类别不同,需要按照子类别进行识别。与传统图像分类任务相比,细粒度图像分类更加具有挑战性,主要原因是细粒度图像具有类间差异小和类内差异大的特点,导致必须借助具有细微差异的局部区域才能分辨出不同的子类别。因此,细粒度图像分类的关键在于准确的部件定位算法,只有得到准确的部件区域,才能提高细粒度图像分类、检索等任务的性能。因此,本文主要针对细粒度图像的部件定位展开研究,提出了无监督的部件定位方法,并在细粒度图像分类任务中加以应用。本文的主要工作有以下:(1)提出了基于模式挖掘的无监督细粒度图像部件定位方法。首先,将从预训练卷积神经网络模型中提取的特征图转换为一系列事务。然后,利用模式挖掘算法从事务数据库中发现频繁模式。这些具有相关性的模式往往在物体的外观和空间结构具有一致性,并且具有强大的判别能力。受此启发,对挖掘到的模式进行合并生成支持图(Support map),以定位细粒度图像中的主要物体和判别力部件。该方法是完全无监督的,利用模式挖掘技术充分挖掘了预训练卷积神经网络模型中的语义信息和空间信息,降低了深度学习对大规模训练数据的依赖。在CUB-200-2011等细粒度图像数据集上的定位实验结果证明了依靠模式挖掘来进行无监督定位任务的有效性。(2)在部件定位的基础上提出了一种基于多层次特征融合的细粒度图像分类方法。该方法通过多分支分类网络学习整体的原图级别特征、全局的物体级别特征和局部的部件级别特征。通过加入全局平均池化和全局最大池化操作,以获取更多的统计信息用于图像特征表示。最后,融合不同分支网络学习到的特征,获得具有更强描述性和更高区分性的特征表示,训练新的分类预测层,完成细粒度图像分类。实验结果表明,相比于其他现有的细粒度图像分类方法,所提方法取得了有竞争力的分类结果,同时验证了多层次特征融合机制对于细粒度图像分类任务的有效性。
其他文献
液固两相流常见于化工、冶金、能源以及环境等工程领域,研究颗粒—湍流之间的相互作用对揭示化工中传热传质、环境工程中雾霾治理具有重要作用。本文从颗粒对湍流边界层内相
随着无线传感器网络、数字通信技术、定位技术等高速发展,以及移动终端设备的大规模应用,可以方便地获取人们日常活动所产生的地理位置信息,从而为轨迹数据挖掘提供了有力的支撑条件。轨迹异常检测是轨迹数据挖掘研究领域的重要分支,它能够判断移动对象是否偏离正常的轨迹路线或者是否发生突变行为。如果能检测出移动对象的异常轨迹,分析出异常发生的原因,那么在未来既可以通过合理的决策规避类似问题,也能够为公安部门在侦破
目的观察肠安逍遥汤治疗腹泻型肠易激综合征的临床疗效及其对患者血清5-HT的影响。方法将90例患者随机分为2组,肠安逍遥汤治疗组45例,匹维溴铵对照组45例,2组均服药6周。观察
自上个世纪末大学大规模扩招以来,我国高等教育蓬勃发展,规模已成为世界第一。然而大学在快速发展的同时,大学定位在总体上却呈现出显著趋同化现象。大学定位是大学办学与发展的逻辑起点,大学定位出现广泛趋同化现象,对大学提升核心竞争力、特色化办学极为不利,影响高等教育大众化以及高等教育内涵式发展,造成大学人才培养、科学研究与社会服务等主要职能与经济社会发展需求不相适应,进而影响国家实现“两个一百年”奋斗目标
C(sp3)-H键是有机分子中基础的结构单元,所以C(sp3)-H键的直接官能团化反应对于复杂分子骨架的合成与修饰具有非凡的意义。然而,C(sp3)-H键的键解离能(BDE)大约为100 kcal/mo
近年来,利用稀土离子掺杂材料进行光学测温的方法获得了人们广泛的关注,上转换荧光材料是其中的研究热点之一,本文研究了 Er3+/Yb3+掺杂YAG、Y203和Lu203单晶光纤荧光上转换
射流搅拌反应器(Jet-stirred Reactor,JSR)是研究燃料氧化和热分解过程的重要基础研究试验装置之一,主要适用于气相动力学的研究,其最大优点是具有高效的气相混合效率,这使得反应器内及其出口处的各组分浓度基本相同。本文在经典的JSR结构基础上进行了改进,并评估了其内部温度场的不均匀性。本文以经典的倾斜式JSR结构为基础,通过CONVERGE软件计算得到停留时间分布曲线和累积分布函数曲
近年来,地震、泥石流、大坝变形、桥梁塌陷、高层建筑引起的地面沉降等灾害的产生,使人们对变形监测的研究越来越重视。在实际的变形监测测量中,由于人为因素、仪器因素、自然因素等导致观测值中包含粗差和系统误差不可避免,这些非随机误差的存在严重影响观测数据的质量,使测量数据成果精度无法达到要求,不能很好的进行预测。为了提高变形监测的精度,非随机误差的处理也是尤为重要。在很多情况下,由于非随机误差产生的原因复
背景TNM分期系统是当前广泛使用的包括胃癌在内的实体肿瘤预后评估系统,淋巴结阴性(N0期)胃癌患者由于无法评估N分期,只根据T分期进行判定,可能无法对预后做出准确预测。另外
心脏病是目前最主要的致死病因之一,超声检查在心脏病临床诊断中应用十分广泛,而多视角超声心动图序列的分割与量化在心脏病的临床诊断中起着关键作用。随着计算能力的快速发展,深度学习方法开始在医学图像处理领域展现出卓越的应用潜力。但是受制于有限的像素级人工标注数据集,大量的噪声干扰、运动伪影以及多个视角之间、不同数据来源之间的差异,多视角超声心动图序列的分割与量化工作面临很大的挑战。现有的方法大多仅关注一