基于改进SSD的光学飞机遥感图像目标检测算法研究

来源 :宁夏大学 | 被引量 : 0次 | 上传用户:limiao912
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子计算机的普及,计算机视觉已经广泛应用于生活的各种领域。小到停车场的车牌识别,大到车辆或者飞机的自动驾驶,这些和我们日常生活中息息相关的事物无疑都充斥着计算机视觉的身影。自从深度学习问世以来,极大的带动了目标检测领域发展的脚步。本文针对当前飞机遥感图像目标检测算法的检测精度与检测速度不能兼顾的问题,提出了基于SSD(Single Shot MultiBox Detector)的飞机遥感图像目标检测算法。本文立足于SSD算法,结合飞机遥感图像自身的特殊性,对SSD算法在飞机遥感图像目标检测中遇到的三个主要问题提出了三种不同思路的改进方案。在本文制作的飞机遥感图像数据集上验证不同改进方案的可行性,最终证明改进后的算法更加适用于飞机遥感图像目标检测,具体改进方案如下。1.针对网络难以准确识别和定位出背景复杂且尺度多变的飞机目标的问题,本文提出了新型特征金字塔网络的飞机遥感图像目标检测算法。该算法相较于改进前主要体现在三个不同点,分别是①新型特征金字塔网络;②损失函数的替换;③特征提取网络的改进。改进后的优势体现在减少了目标漏检和误检的发生。2.针对极小尺寸目标难以被检测和不同尺度锚框匹配到飞机目标数量差距过大的问题,本文提出了正样本锚框数均衡化的飞机遥感图像目标检测算法。该算法相较于改进前主要体现在三个不同点,分别是①特征提取网络的改进;②锚框密集化;③锚框策略匹配。改进后的优势体现在可以平衡不同尺度的正样本锚框数量,使得网络不偏向某一尺度目标进行学习,对检测精度与鲁棒性的提高均有积极作用。3.针对网络浅层特征信息不完整和锚框尺寸与飞机目标尺寸不匹配的问题,本文提出了浅层特征融合与K-Means聚类的飞机遥感图像目标检测算法。该算法相较于改进前主要体现在三个不同点,分别是①SFE浅层特征增强模块;②使用K-Means聚类方法计算得到锚框的参数;③使用Soft-NMS替换NMS用以减少目标的漏检率。改进后的优势体现在提升了网络对小型飞机目标的检测精度,还加快了网络的收敛速度。本文提出的三种改进算法在本文制作的飞机遥感数据集上进行相关实验,精度均值分别为91.15%、91.88%和92.45%。实验结果表明,以上三种改进方法均可以较好的检测飞机遥感目标。
其他文献
随着“一带一路”倡议的提出,非物质文化遗产作为一个国家的历史文化标志,对于宣传本国文化具有重要意义。本文在评价理论的指导下,将非物质文化遗产新闻作为翻译实践语料,通过分析新闻中作者的情感、判断、鉴赏等方面态度观点,以及文本中评价性语义的介入方式和级差表达,运用一定的翻译策略和方法传达原文人际意义,以达语篇人际功能的对等。该实践报告包括四个章节。第一章为翻译任务介绍。主要包括文本介绍、翻译过程介绍、
学位
本文以Cyber Bullying:Bullying in the Digital Age中的第一和第二章的汉译为例,以目的论为指导,分析、总结了翻译实践中存在的问题与难点,探讨、归纳了翻译信息类文本所使用的方法。原文本以蓬勃发展的网络时代出现的日益严重的网络欺凌现象为话题,讨论了如何正确认识和预防网络欺凌现象,有助于构建健康、安全的网络空间。本文属于信息类文本,具有说明、传递信息的功能。为了实现
学位
本文是一篇汉英翻译实践报告,笔者以《世界银行贷款项目竣工报告》第一章和第二章的翻译为基础,结合具体案例,探讨了在纽马克语义和交际翻译理论在此次翻译实践中的应用。本翻译实践报告主要包括翻译任务描述、翻译过程描述、文献综述、案例分析、实践翻译总结。第一部分是翻译任务描述,笔者介绍了翻译文本的来源,以及本次翻译实践的意义。第二部分对翻译过程进行描述,具体包括译前准备、翻译过程和译后校对。第三部分为文献综
学位
人工智能发展迅速。自新冠肺炎疫情爆发以来,人工智能技术在抗击疫情中发挥了很大的作用。以此为基础的翻译项目对读者和译者都有一定的意义。笔者选取了《人工智能在疫情中的应用》的第一章和第三章为翻译实践素材,文章介绍了世界大流行病毒以及人工智能技术在分析和预测确诊病例的作用。本文以德国功能学家赖斯的文本类型理论为指导进行了翻译实践,详细分析了如何运用文本类型理论解决科技文本中翻译的问题。在翻译过程中,笔者
学位
本文是一篇英译汉笔译实践报告。笔者选择V.K.Joshi《简明葡萄酒科技百科全书》的第一章作为翻译材料,在目的论的指导下,分析了本人在翻译葡萄酒文本时遇到的困难,并提出了相应的翻译技巧。该文本具有信息型文本的特点,首先对葡萄酒的历史和酿造技术进行了概述,涵盖葡萄酒产区、酿酒葡萄品种,以及世界葡萄酒市场贸易和旅游等主题。近年来,中国葡萄酒在世界舞台上脱颖而出。尽管中国葡萄酒的起源相对较早,但大多数成
学位
本报告以英文原著The 5 Love Languages of Chidren中第一至第三章英译汉实践为例,根据胡庚申教授提出的生态翻译学理论,从语言、文化和交际三个维度进行英汉语言转换和适应性选择,并归纳总结了适用的翻译方法以应对说明类文本的翻译任务。原文本语言准确、简短,内容逻辑性强;作者强调父母要主动了解孩子表达爱的方式,也要正确地表达对孩子的关爱,从而加强父母与孩子的沟通。依据生态翻译学理
学位
本文是一篇汉英翻译实践报告,以杨本芬《秋园》第一章和第五章的翻译为基础,结合具体案例,探讨了叙事文体学理论在翻译实践中的应用。《秋园》以中国近百年历史社会变迁为背景,讲述了一位普通中国女性一生的故事。本书自2020年6月出版以来,受到读者广泛关注和喜爱。叙事文体学是一种以叙事学为框架来分析文本的文体学研究,综合了叙事学与文体学的研究重点,能从“叙事”和“文体”两个层面更好的理解文学作品。本报告尝试
学位
本文是一篇关于《百年风雨:她话人生》的英汉笔译实践报告。作者是米里亚姆·米季扬(Myriam Miedzian)和阿里萨·马利诺维奇(Alisa Malinovich),该书是她们基于对美国三代女性的采访而写成的报告文学。书中讲述了不同女性的生活、成长方式及工作,反应了她们在当时的社会地位。本文分析了翻译《百年风雨:她话人生》过程中如何在CEA(理解、表达、变通)框架的指导下,使译文忠实、通顺。在
学位
滑坡作为危害最为严重的地质灾害之一,给人类的生命和财产造成巨大损失,因而针对滑坡隐患的可靠、及时识别具有重大的社会与经济意义。传统的滑坡识别方法主要是依赖高分辨率光学遥感图像,常用的人工目视解译方法精度高效率低,专家知识依赖性强,难以满足大数据量遥感图像判读,因而基于深度学习的遥感滑坡自动识别方法逐渐得到关注与应用,深度学习方法能够自动提取滑坡隐患相关特征,端到端的训练模式极大提高了滑坡识别效率与
学位
针对原始鸽群优化的二维最大类间方差法(Otsu)图像分割算法收敛速度慢的缺点,提出了基于混合分数阶鸽群优化的Otsu图像分割算法。算法将分数阶与鸽群算法结合,利用分数阶微积分的记忆性,使鸽群依据更多历史记忆获取更精确最优值,并进行分数阶增强滤波预处理,提高分割精度,引入混沌搜索算法增强种群多样性,提高全局搜索能力。将Otsu算法的离散度矩阵作为改进算法的适应度值,从而快速搜索最佳阈值,进行图像分割
学位