基于深度卷积特征的细粒度图像分类研究

来源 :江西农业大学 | 被引量 : 0次 | 上传用户:jinhuikkkl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度学习技术日渐成熟,使得计算机视觉领域相关问题的研究进程得到了加速。在卷积神经网络问世以前,学者们通过构造人工特征来完成各项任务。但这种方法需要进行大量的数学运算,在复杂度以及效率方面存在较严重缺陷。卷积神经网络的出现,实现了对图像特征的自动提取,并且有相关资料表明,使用深度卷积神经网络得到的特征比人工特征具有更强的表述能力,基于深度卷积特征的算法往往能够获得更显著的分类效果。基于强监督的分类算法,依赖人工标注特征,辅助网络提取特征。这类算法对数据集的要求较高,需要具备专业知识的领域专家对每张图片进行标注,而细粒度数据集通常包含上万张图片,涉及到的种类繁多,其工作量不言而喻,既费时费力又费钱,工作效率也很低。基于以上原因,本文提出三种弱监督的基于深度卷积特征的细粒度分类模型,通过提取关键局部特征并挖掘其中的潜在关联来增强特征的表达能力,完成对细粒度图像更准确的分类。主要提出了以下三个模型:(1)自注意特征跨层融合的细粒度图像分类模型此模型利用自注意力机制获取每个由预训练模型提取的高层卷积特征的通道间关系,并通过点乘运算将其融合到特征中,不同层自注意特征间的双线性操作用来获得特征的层间关系,从而学习到跨层双线性特征。该算法在CUB-200-2011、Stanford Cars、FGVC-Aircraft数据集上的分类准确率分别为86.7%、93.0%、90.4%。(2)基于层级注意力的细粒度分类模型由于(1)中的自注意力特征的获取会增加计算量,甚至可能造成维度爆炸。因此,将其替换为滤波器增强的方式。在减少计算量的情况下,实现特征图的增强。该模型保留跨层双线性操作,通过高亮特征与对应的跨层双线性特征的外积运算,得到层级注意力特征。该算法在以上三个数据集上的分类准确率分别为87.96%、93.82%、90.74%。(3)基于自层和跨层双线性特征的细粒度分类模型虽然判别特征有助于分类,但也容易造成过拟合。于是,该模型尝试挖掘特征内部的通道之间的联系。将这些特征的内部通道关系和外部层间关系融合在一起,在一定程度上形成互补,能够增强特征描述能力。该算法在以上三个数据集上的分类准确率分别为88.26%、94.32%、91.47%。综上所述,本文的主要贡献总结为以下几点:(1)针对细粒度图像局部关键特征难以提取和建立有效特征表示的问题,提出自注意特征跨层融合模型。利用自注意力定位重要局部区域,得到自注意特征,并利用跨层双线性操作,挖掘不同层自注意特征间的相互关系,以达到增强特征表达能力的目的。(2)为解决自注意特征计算成本较高的问题,提出滤波器增强的方式来高亮特征图中的关键位置,得到高亮特征,并通过高亮特征与双线性特征间的叉乘运算,将局部属性信息和内在关系融合,得到增强后的特征表示。该方法不仅避免了大量计算,同时还提高了模型准确率。(3)为进一步提升模型性能,通过自层和跨层的双线性操作,挖掘每个卷积特征内部的通道关系以及不同特征间的外部空间关系,将这些自层双线性特征和跨层双线性特征汇合,构造更加完善的特征表示。
其他文献
离子型稀土是我国特有的珍贵重稀土资源,江西赣南地区具有丰富的离子型稀土资源,素有“稀土王国”的称号。离子型稀土矿多年的无序开采带来了严重的生态环境问题,如大面积的表土破坏、土壤肥力下降、土壤酸化、土壤浸矿剂残留等。传统的土壤物理、化学改良方式往往具有成本高、难以推广的劣势。而采用生物改良剂结合功能性微生物协同修复的方式为离子型稀土尾矿退化土壤的生态修复提供了新的思路。本研究以江西省赣州市信丰县某离
近年来宽禁带深紫外光电探测器因其在众多应用领域备受需求成为研究热点。但其中材料薄膜的生长,器件的制备成本和性能以及制备过程中造成的重金属和气体污染等问题仍然值得思考。综合以上问题在本文中设计了一种基于碳点材料的深紫外光电探测器并对其性能进行了研究。该碳点作为一种碳基的天然宽禁带材料在深紫外区域拥有优越的吸收特性,同时碳点材料的制备过程采用蒸馏水作为电解液的绿色自然的电化学方法,器件的制备过程简便快
学位
相变存储器(PCM)因其低功耗、存储速度高、寿命长、低成本、非易失性等优点,将成为未来存储器的主流产品,然而直接决定PCM性能的是其作为存储介质的相变材料。众所周知,Ge2Sb2Te5(GST)为最常见的相变材料之一,但其存储器件表现出的热稳定性较差,功耗较高,可靠性较低等缺点,需要有待改善。为提高其相变材料的性能,用结晶温度、晶态电阻相对较高的ZnSb来代替GST,但在研究过程中,发现ZnSb在
由于高分辨距离像(HRRP)易于获取和存储,基于高分辨距离像的目标识别研究成为雷达目标识别领域的热点。本文围绕基于高分辨距离像的目标识别展开研究,主要贡献在于提出了可学习先验卷积变分自编码机和解耦表征卷积变分自编码机。二者在原始变分自编码机的基础上融入类别标签监督信息,以此更加有效的提取高分辨距离像特征。本论文的内容主要包括以下部分:1.研究了高分辨距离像目标识别的基本框架。具体对高分辨距离像的敏
印制电路板(Printed Circuit Board,PCB)作为各类电子信息产品的重要部件之一,其主要功能是支撑和互连电路元器件。而且,消费者对电子产品在智能化、轻薄化、小型化以及多功能化等方面的需求增长驱动着印制电路板不断向着高精度、高密度和高可靠性方向发展。通孔电镀铜是连接多层电路板的层与层之间的“桥梁”之一,并对下一代先进印制电路板制作有着重要指导意义。然而,直接采用直流电源进行通孔电镀
大量研究表明,在很多生物过程中,长非编码RNA(lncRNA)有着重要的功能,它们调控生物的生理过程,影响着细胞内稳态的各个方面,而这些lncRNA的变异或功能失调有可能导致一些复杂疾病的发生。lncRNA由于其在多种生物学过程中的关键作用,正成为生物学和医学领域的研究热点,在多种肿瘤疾病中具有潜在作用,有望成为新生物标志物和药物靶标。利用计算生物信息学方法预测潜在的lncRNA-疾病关联,对于探
粮食安全问题是关乎人们生存及健康的基本问题。40多年以来我国粮食产量和种类一直在增加,其品质也一直在提升,这靠的是政策和制度,同样也靠科学技术。科学技术在农业中的贡献率高达60%以上,对我国粮食的增产发挥了巨大的支撑作用。尽管如此我国农作物仍不同层度地受着植物病虫害的侵害,而寻找更多结构新颖的微生物农药来替代化学农药是解决粮食安全问题的一大方向。本文旨在明确放线菌JN18的生物学基本信息,并为其作
研究背景及目的:乳腺癌是一种激素依赖性的肿瘤,其发病率在全球范围内逐年增加,已居于中国妇女恶性肿瘤发病的第一位,是女性癌症患者最主要的死亡原因之一。乳腺癌的发生除了与雌激素、瘦素等多种内分泌激素有关外,机体微环境的免疫状态对乳腺癌的形成也发挥着重要作用。当机体处于免疫抑制状态,特别是局部微环境中抑制性T细胞亚群数目、比例发生失调,可形成免疫抑制网络,从而保护肿瘤逃避免疫攻击,导致肿瘤生长、浸润及转
纤维素的生物降解是通过微生物来源的纤维素酶的协同作用来水解纤维素,具有过程简单、转化率高、无污染等优良特点而被广泛应用。纤维素酶是一种多组分酶,包括纤维二糖水解酶、内切葡聚糖酶、β-葡萄糖苷酶等。其中,β-葡萄糖苷酶能将纤维二糖降解为葡萄糖,有效提升了水解产物对纤维素酶的抑制作用,是纤维素降解过程中的关键限速酶,其已在工业、农业、食品、医药、生物能源等领域广泛应用。β-葡萄糖苷酶主要来源于天然的植