【摘 要】
:
图像场景识别是计算机视觉领域中的一项基础性研究,场景富含丰富的语义信息,能够为目标检测、动作识别、自动驾驶等其他视觉任务提供支持,在导航、无人机视觉等领域也有广泛的应用。由于场景内容的多样性,传统的手工特征难以全面表达场景图像的隐含信息。而近年来,深度学习在计算机视觉领域取得了显著的成功,因此本文采用能够自动学习提取图像特征的深度学习方法对图像场景识别展开研究,主要内容包括:本文对不同的图像分类任
论文部分内容阅读
图像场景识别是计算机视觉领域中的一项基础性研究,场景富含丰富的语义信息,能够为目标检测、动作识别、自动驾驶等其他视觉任务提供支持,在导航、无人机视觉等领域也有广泛的应用。由于场景内容的多样性,传统的手工特征难以全面表达场景图像的隐含信息。而近年来,深度学习在计算机视觉领域取得了显著的成功,因此本文采用能够自动学习提取图像特征的深度学习方法对图像场景识别展开研究,主要内容包括:本文对不同的图像分类任务进行对比研究,主要分析物体分类和场景识别所用的数据集差异。首先,从两种数据集中各取图像样本进行比较,发现两种数据集中物体的数量和类别存在显著差异;然后,通过对图像中物体的数量大小进行统计发现两种数据集上还存在物体的尺度变化差异。最后,采用反卷积计算类激活图(class activation diagram)的方法,探索这些差异对场景识别任务的影响。针对场景识别任务与物体分类任务存在的差异,本文提出一种基于卷积神经网络多级别特征融合的场景识别方法,目的是减小场景中物体的数量尺度变化对卷积神经网络训练学习的影响,提高网络的精度和泛化性能。该方法的主要工作是设计不同级别的特征,分别对应图像中局部细节和全局的场景描述,并改进AlexNet网络模型,使其能够提取设计的多级别特征。最后,对不同级别的特征进行融合,在相关数据集上进行实验验证。本文还提出一种基于Inception结构优化的场景识别方法,该方法在提取多级别特征的基础上,采用全局均值池化替代了全连接层,减少了网络参数,提高了网络的训练速度。此外,本文对不同场景类别下的特征融合方式展开研究,利用F-score和混淆矩阵衡量网络对于不同类别场景的分类效果,最后提出一种基于Inception结构的分类置信网络,从而提高多类别场景识别的准确性。在大型场景数据集MIT Indoor67、SUN397、Places365上,对本文提出的两种方法进行相关的实验验证,实验结果表明本文提出的方法能有效提高场景识别的精度。
其他文献
为了提高刀具的切削性能和使用寿命,当前刃口钝化技术被不断重视,常见的刃口钝化形貌主要有圆弧型刃口、瀑布型刃口及倒棱型刃口等。圆弧型刃口的处理方法已得到广泛的应用,
防波堤是港口工程中的重要设施,其作用是保护港口的水域不受波浪的侵袭或减小波浪的作用。台风浪对防波堤起到了很大的破坏作用,往往使得防波堤遭受严重的破坏,而且破坏的方式多种多样,也给破坏后所要进行的修复工作带来一定的困难。本文以沿海某电厂防波堤在“山竹”台风浪作用下破坏为研究背景,总结了国内外学者对防波堤的研究内容,归纳了研究成果和其中的不足。某电厂防波堤采用的是直立式防波堤与斜坡式防波堤相结合的方式
奇异摄动问题在科学技术和工程领域均有广泛应用,包括多孔介质的渗流问题,河网水质问题,金融模型中的Black-Scholes模型等。这些问题中对于小摄动参数ε引起的边界附近出现的
东北是我国重要的春玉米主产区,辽北地区地处东北南部的松辽平原,这一地区气候条件有利于玉米生长发育,是辽宁省玉米主产区。为了探究耕作栽培措施对该地区玉米产量和资源利用效率的影响,连续三年(20172019年)在辽宁铁岭县开展田间玉米栽培模式大区对比试验,玉米品种选用“先玉335”和“郑单958”,设置不施肥旋耕等行距(T1)、一次性施肥旋耕等行距(T2)、秸秆还田+氮肥分期翻耕等行距(T3)和有机肥
植物多样性是植物与其他有机体及其生存环境之间长期相互作用下形成的生物系统以及与此相关的各类生态过程。植物物种多样性和功能性状多样性的综合研究有助于更好地解析植物
群落构建作为生态学的一个核心问题,对于理解物种共存机理和生物多样性维持机制具有重要作用。不少生态学者致力于揭示群落构建机制,开展了大量的研究工作,探索不同的生态过
本文系统研究了稀土(Gd3+、Tb3+、Eu3+)掺杂磷酸三钙(TCP)的结构、发光及水化性能。运用高温固相法结合空冷和炉冷两种冷却方式合成了不同浓度Gd3+、Tb3+和Eu3+离子掺杂的磷
句子相似度建模是许多自然语言处理应用的核心,因此备受关注。由于语言表达的模糊性和可变性,测量句子相似性具有挑战性,近年来也受到了很多关注。以前大量的工作集中在特征工程上,并且已经证明几种类型的稀疏特征是有用的。最近,由于词嵌入的成功,研究人员试图通过句子嵌入来研究句子相似性建模。这一类中的大多数方法专注于学习句子的语义信息并将其建模为连续向量,然而句子的句法信息尚未被充分利用。另一方面,先前的工作
裂缝是碳酸盐岩油藏油气储集的重要空间和流体运移的主要通道,对开发效果有很大影响,碳酸盐岩储层裂缝扩展规律复杂。因此,研究裂缝在开发过程中的动态扩展规律,对于科学高效
城市污泥农用是目前国际上污泥资源化处置的重要途径之一。但由于污泥中含有重金属等有毒物质,使污泥作为肥料在农地中施用受到很大限制。与污泥农用相比,由于林地具有远离人