【摘 要】
:
在计算机视觉领域,通用图像分类已经发展成为了非常成熟的研究方向,各种通用图像分类算法在Image Net等数据集上已经达到了很高的准确度。目前,人们对图像分类粒度有了更高要求,细粒度图像分类成为研究热点。但是细粒度图像具有类内差异大、类间差异小的特点,传统图像识别技术适用于类别图像差异较大的粗粒度分类,对于精细化识别的表现不尽人意。而基于强监督学习的细粒度图像分类方法过度依赖物体标注框和部位标注点
论文部分内容阅读
在计算机视觉领域,通用图像分类已经发展成为了非常成熟的研究方向,各种通用图像分类算法在Image Net等数据集上已经达到了很高的准确度。目前,人们对图像分类粒度有了更高要求,细粒度图像分类成为研究热点。但是细粒度图像具有类内差异大、类间差异小的特点,传统图像识别技术适用于类别图像差异较大的粗粒度分类,对于精细化识别的表现不尽人意。而基于强监督学习的细粒度图像分类方法过度依赖物体标注框和部位标注点,大大增加了人工成本。本文基于弱监督学习,利用显著性检测和多注意力机制对细粒度图像分类进行研究,主要研究内容如下:(1)基于显著性区域检测与多层级特征的细粒度图像分类为了找到图像的辨别性特征,提出基于Grad-CAM显著性区域检测与多层级特征的细粒度图像识别技术。首先采用Grad-CAM自动定位输入图像中的关键区域,然后根据显著性区域定位结果构建双路的卷积神经网络,一个分支用来提取全局特征,另一个分支用来提取局部特征,将两部分特征通过双线性池化操作得到双线性特征。并利用特征金字塔将两个分支中多层级的特征图进行融合,最后把双路卷积网络得到的双线性特征与多层级特征进行组合,增大特征维度,增强网络的特征表达能力,完成分类。实验结果表明,该方法在鸟类数据集上取得分类性能提升。(2)基于注意力机制和多尺度特征的细粒度图像分类注意力机制可以帮助定位特征图中的显著性特征,本文提出基于注意力机制和多尺度特征的细粒度图像分类方法。把通道域和空间域注意力模块分别嵌入到残差网络中,分别关注对于细粒度图像有区分性的通道和局部空间位置,通过加权操作增强相应区域的特征响应,减少无关特征的影响;采用尺寸大小不同的图像作为网络的输入部分,通过对两个图像进行卷积操作以获取不同尺度的特征,融合多尺度的特征可以更加全面的描述图像的局部信息;最后将小尺度特征上采样到大尺度特征的相同大小,并用双线性池化的方法将两种尺度的特征进行融合,得到用于分类的多维度特征。通过实验结果验证该方法在细粒度数据集上的有效性。
其他文献
目前,图像和视频已成为人们生活中最重要的信息传播载体之一,而图像和视频目标分割技术在图像和视频处理中扮演着重要的角色,且已广泛应用于影视制作、虚拟现实和智能监控等多个领域。交互式的图像和视频目标分割技术根据用户在图像或关键帧的标记作为分割的先验信息以获得分割结果。然而,针对具有复杂场景的图像和视频,现有的分割方法想要获得准确的分割结果,往往需要在前景和背景区域提供大量的用户交互。因此,本文围绕图像
进入21世纪,越来越多企业意识到人力资源是企业竞争、发展的核心资源,企业如何使员工工作行为符合公司的发展要求也成为研究者和实践者关注的焦点。家长式领导受中国传统文化的影响普遍存在中国企业中,但通过回顾以往的研究发现,对于家长式领导如何影响员工行为这一问题的回答还不充分。因此本文将在中国情景下,通过理论结合实证的方法探讨家长式领导对员工反生产行为的影响机制。本研究以国内外关于家长式领导、员工反生产行
随着经济全球化的发展,跨境资本流动日趋频繁,离岸信托作为离岸金融业务的一项重要内容,因为其自身具有的结构优势及税收优势,成为高净值人士进行资产隔离、财产保全和财富传承的首选。但是由于涉税信息交换和全球资产透明化的发展,尤其是在CRS出台之后,越来越多的国家或地区参与到CRS中来,根据CRS规定的涉税信息交换机制,具有合规身份的离岸信托将会被启动尽职调查程序,并对其相关税务信息进行核查申报,其本身所
聚氨酯(PU)已成为当今用途最为广泛的合成高分子材料之一,可制成泡沫、弹性体、涂料、纤维等,其中以泡沫用量最大,而泡沫又以硬泡和软泡为主。通用PU泡沫极易燃烧,氧指数仅为18%左右,并且燃烧时产生有毒气体,因此提高PU泡沫的阻燃性始终成为PU泡沫界关注的课题。提高PU泡沫的阻燃性,一是在聚氨酯分子链结构中引入阻燃性元素或基团;二是在其制备过程中添加阻燃性组分。本文拟采用第一种方法,分别以Manni
造价预测是地铁土建工程造价控制和管理的重要内容之一,它的精确程度直接影响到项目的投资决策、建设规模确定以及工程设计方案制定的科学性,因此其研究具有重要意义。地铁土建工程造价的影响因素众多,且不确定性大,其造价与其自身特征又具有高度的非线性关系,可见对地铁土建工程造价预测研究的关键问题主要是造价影响因素的选取、预测方法的选用及其优化。本文拟选用基于神经网络贡献分析的变量选取方法,结合具有强大的处理高
随着中国加入世贸组织,各种形式的金融活动在全世界范围内频繁展开。为了与投资者建立良好的商业关系,公司每年都会发布年报。上市公司的年度报告是投资者了解该公司的主要渠道,涵盖了大量的专业术语,用于披露和展示公司上一年度的生产经营状况,财务收支以及企业管理状况,向公众和潜在投资者传达企业的基本信息和投资价值。本翻译报告选取马来西亚文语控股公司2018年年报的第六到第九部分作为翻译原文,其中包括了公司简介
本文在综述了Mg基储氢材料的发展及研究现状的基础上,通过机械球磨法制备纳米级Mg基复合材料,并利用X射线衍射(XRD)、透射电子显微镜(TEM)、Rietveld全谱拟合以及气态P-C-T储氢测
湿地植被是湿地三要素之一,对维持湿地过程具有重要作用。本文以桂林会仙岩溶湿地公园的核心区为研究区,以无人机DOM影像及纹理特征、DSM为数据源,整合面向对象的随机森林算法和人工目视解译制作岩溶湿地标签数据,基于Seg Net、PSPNet、RAUNet和Deep Lab V3plus网络架构为方法构建岩溶湿地植被信息识别的深度学习遥感模型,为了提高模型识别植被的精度并进一步分别利用软投票法、硬投票
近年来,半导体气体传感器因其独特的优势而被广泛应用在很多领域,而不同形貌的半导体材料会使其比表面积和晶面暴露有所差异,致使材料表现出不同的气敏性能。本文以硝酸镓和硝酸镉为原料,制备了片状CdGa_2O_4、球状CdGa_2O_4和米粒状CdO-CdGa_2O_4复合材料,用X射线衍射、SEM、HRTEM、X-射线光电子能谱、红外光谱等手段对材料进行了表征。全文共分为四章:第一章:主要介绍了气体传感
在高光谱遥感及其数据分析技术快速发展的今天,对成像光谱仪获取的高光谱图像进行目标检测逐渐成为了学科中的重要研究方向之一。尤其是结合了人类视觉机制的显著性目标检测,它能够使得场景中的目标从背景中脱颖而出,无需人工干预,因此具有很强的实用性。传统的显著性目标检测算法一般采用的是直接降维结合差分的方式,往往会损失图像信息,对显著目标的特征提取不充足。因此如何充分利用高光谱数据的空谱信息,实现复杂场景中显