基于深度网络的遥感图像描述方法研究

来源 :中国矿业大学 | 被引量 : 0次 | 上传用户:shipeicheng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像描述,即产生给定图像的自然语义描述,是使得机器能够理解图像内容的关键任务。遥感图像描述是此领域的一部分。大部分主流的图像描述模型通常由编码器和解码器组成。在编码器部分,使用卷积神经网络提取图像特征。在解码器部分,通常使用循环神经网络及其变体,如长短期记忆网络,输出给定图像的描述性文本。然而,当前的遥感图像描述模型存在过拟合问题,并且没有充分利用图像中的语义信息。为此,本论文基于编码解码架构搭建模型,采用了微调网络架构的Transformer作为新的解码器。并且针对于遥感图像描述模型,设计了基于变分自编码器的两步优化算法,创新点如下:针对遥感图像数据集规模偏小,容易过拟合的问题,本论文提出采用微调网络架构的Transformer作为新的解码器,创新点如下:在原始Transformer的基础上添加了额外的dropout层和残差连接并对提取的特征进行了自适应融合,将编码器编码的低层空间特征和高层语义特征同时传输至解码器进行解码,并将强化学习引入至遥感图像描述模型,进一步提升遥感图像描述模型的性能。另外,针对因遥感图像和自然图像之间的差异而导致的ImageNet上预训练的编码器对遥感图像特征提取能力不足的问题,对本论文提出了基于变分自编码器的两步优化算法,创新点如下:将遥感图像描述模型的优化过程分为基于多任务学习的编码器参数微调和基于图像描述的解码器参数优化。在编码器参数微调阶段,本文使用遥感图像分类数据集,在卷积神经网络上与添加基于变分自编码器的支路,使得卷积神经网络在进行图像分类的同时在支路上还原重建输入的图像,在此基础上对卷积神经网络的参数进行微调。在基于图像描述的解码器参数优化阶段,在编码器输出的图像空间特征上采取自注意力机制,获取更好的图像空间特征表示。通过在公共数据集上的实验结果可以表明,本文提出的方法可以有效缓解遥感图像描述任务上的过拟合问题,提高编码器对于遥感图像的特征提取能力,充分利用编码器提取的遥感图像的语义信息,极大地提高了生成的描述文本的质量。在BLEU1-4,METEOR,ROUGE-N和CIDEr七项评价指标上,本文提出的方法的性能超过当前最优的遥感图像描述模型。
其他文献
汉语语音的研究主要有对比分析、习得研究和偏误研究。语音偏误是系统汉语教学中学生较早出现的问题,也是老师较早遇到的教学困难。汉语语音偏误分析的国别化研究以韩国和泰
随着世界粮食的不断增产,农药的使用也日益普及。杀菌剂更是在农药中扮演了一个不可或缺的角色。研究新型的高效杀菌剂将对后续农药的开发,以至于粮食产量的增加具有较大意义
与传统Internet普遍使用场景不同的是,容迟网络(Delay Tolerant Network,DTN)—般主要应用在比较极端的挑战性环境下,在此种情况下,由于受节点自身因素及外部环境等各方面的
现阶段的机器学习是一个学习数据规律进行预测的过程,而其中关键的步骤则是数据降维。特征提取方法相较于其他降维方法而言更能挖掘数据的本质信息。由于许多实际数据并非线
随着无线通信技术的快速发展,用户通过无线网络获取文件内容的需求急剧增长。然而,对于流行的文件内容,特别是视频内容,当用户都从远程服务器获取这些流行的内容时,将会造成
移动边缘计算(mobile edge computing,MEC)网络在距离用户最近的无线接入网部署边缘云服务器,创建具备高性能、低延迟与高带宽的服务环境,能为用户提供信息处理和云计算能力
荧光粉转换白光发光二极管(pc-WLED)由于具有成本低、使用时间长、质量高、效率高等优点,引起了大众的日益关注,被认为是传统白炽灯和荧光灯照明的有效替代品。其中,基质材料有
脑电信号作为一种重要的生理电信号,在临床医学、脑机接口等科研领域具有广泛的应用和重要的意义,是自然科学研究的重要组成部分。但由于脑电信号是一种微弱的非平稳随机信号
表面增强拉曼光谱(SERS)是一种极高表面检测灵敏度的检测表面物质指纹振动信息的光谱技术,甚至在特定的条件下,灵敏度可达到单分子水平。随着SERS效应的发展,SERS已经广泛应
由于预脉冲电流幅值、主脉冲电流幅值等参数变化对激光的影响并未有规律性结论,本文将主要对内径为4.0mm毛细管的46.9nm毛细管放电软X射线激光特性在改变实验条件下的变化规