基于效率网络的自然图像检测算法研究

来源 :西华大学 | 被引量 : 0次 | 上传用户:buynewer1111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然图像的识别和处理在视觉语义分析领域有十分重要的意义,目标检测是自然图像识别和处理最关键的技术之一。现有自然图像目标检测方法主要建立在深度学习算法基础上,围绕更快、更新的深度模型训练展开研究。但是以效率网络为代表的现阶段深度学习检测模型在拓展模型深度和精度的同时,忽视了对模型结构和参数的优化,且未对不同检测对象的特点展开分析,存在检测不规则目标时精度低的问题。因此,有必要对现有效率网络检测自然图像展开针对性的研究。针对以上三点问题,本文基于现有效率网络模型对模型结构调整、参数优化和极点框预测改进三方面开展研究。1)对EfficientNet模型和EfficientDet模型结构优化整合得到Con Det模型。首先,针对Efficient Net模型训练和检测效率低的问题,对特征提取单元卷积方式提出改进,在不损失检测精度情况下,训练时间缩短5.1%,检测时间减少了2.4%;其次,针对EfficientDet模型特征提取和特征融合效率低的问题,对特征提取迭代方式和特征融合权重提出改进,m AP较EfficientDet模型分别有14.0%和0.9%的提升;实验结果表明,由效率网络改进得到的Con Det模型,对自然图像检测m AP为53.5%,较EfficientDet模型有3.7%的提升。2)利用CSCWOA优化ConDet模型参数和训练过程得到Pro Det模型。首先,针对Con Det模型训练和检测效率低的问题,确定利用WOA优化Con Det模型;其次,对WOA收敛速度慢的问题,提出基于交叉选择和自适应阈值的改进,得到CSCWOA用于优化Con Det模型参数和训练;实验结果表明,改进优化后的Pro Det模型检测自然图像m AP为54.6%,较Con Det模型训练效率最高提升2.9%、检测时间最大缩短9.7%。3)ProDet模型检测规则目标的自然图像取得较好的m AP,但自然图像中存在大量不规则目标,为提升Pro Det模型对不规则目标的检测性能,利用极点检测替换Pro Det模型的锚点检测得到ExtDet模型,并将Pro Det和ExtDet模型整合为ExtDetv2模型。利用极点特征提取、特征回归和后处理算法替换Pro Det模型锚点检测,得到ExtDet模型;整合低复杂度的ExtDet模型和高复杂度的Pro Det模型,得到ExtDetv2模型;实验结果表明,ExtDetv2模型检测不规则自然图像m AP为41.0%,较Pro Det模型提高4.1%。本文基于效率网络检测自然图像的研究,旨在优化效率网络结构和参数、减少目标预测框中的背景区域,提高检测精度,适用于语义分析、环境安全等自然场景识别领域。
其他文献
2020年以来,新型冠状病毒开始在我国肆虐,当时环境下最有效的处理办法就是血浆疗法,但血浆疗法中输入到患者体内的新鲜血液中含有大量活性淋巴细胞,有可能导致患者出现输血相关性移植物抗宿主病,为了避免这种情况,就需要使用血液辐照仪对血浆内的淋巴细胞进行灭活处理。课题组结合专业领域并根据本次疫情的需求,创新性地提出了一种基于X波段2.5 MeV电子直线加速器的血液辐照仪,相较于比较成熟的S波段直线加速器
学位
在晶体中掺杂一些过渡金属离子(TMs)可以显著地改善材料的物理化学性能,因而掺杂技术被广泛应用于各个领域。如热电材料、超导体材料、半导体材料等,其性能主要是由晶体的局部结构和TMs的电子态决定的。这是因为掺杂的TMs根据Jahn-Teller效应,可以有效地改变其局部结构,从而影响材料的性能。为了清楚其具体机理,人们通常借助电子顺磁共振(EPR)的自旋哈密顿参量(SHPs)进行全面分析。EPR是研
学位
矢量光束是标量光束的拓展;涡旋光束则是一种具有螺旋相位结构且还携带轨道角动量的光束。矢量光束和涡旋光束是现代光学中十分重要的两类光束,被广泛研究并且广泛应用于光学操纵、光学显微、光学存储、量子信息处理等领域。近些年自由空间光通讯快速发展,而大气湍流的存在会带来光强闪烁、相位畸变等一系列的湍流效应,这将导致通信误码率增加,降低系统的信道容量,极大影响通讯效率。研究表明矢量光束和涡旋光束具有较强的抗湍
学位
大规模多输入多输出(MIMO,Multiple Input Multiple Output)系统是第五代(5G,5th Generation)无线通信系统的关键技术之一。在大规模MIMO系统中,下行链路波束成形、用户选择和天线选择等都需要准确的信道状态信息(CSI,Channel State Information)。在时分双工(TDD,Time Division Duplex)模式下,下行链路C
学位
随着深度学习方法在图像去运动模糊领域的不断发展,现有算法的主要思路是通过设计不同的网络模型或者加深网络来提高算法去运动模糊的效果,但是却忽略了图像的实际退化过程,在模型设计时没有考虑噪声的影响,且模型复杂,计算开销大,以致于去运动模糊效果在主客观评价指标上都有待提高。因此,实现更好的去运动模糊效果和简化网络模型是十分重要的。在此背景下,论文主要围绕运动模糊图像的去模糊问题展开研究,工作总结如下:(
学位
心血管疾病和呼吸系统疾病的发病率呈上升趋势,危害着人民健康。心音信号与肺音信号中包含了大量的心血管系统和呼吸系统的病理信息,能有效辅助医护人员进行诊断。听诊是常见的获取心音信号和肺音信号的手段,但采集的往往是心音信号和肺音信号互相混叠和干扰的心肺音信号。针对这一问题,本文进行了以下研究:1)提出了用于实现单通道心肺音信号分离的一种多重约束的非负矩阵分解算法(MCNMF)。本文研究了非负矩阵分解(N
学位
近年来随着社会发展以及人们对生活和艺术的追求,音乐创作的需求量大幅增加,其生产、传播和消费途径均发生了较大的变化,这给传统的音乐创作带来了挑战,如何快速创作出一首满足特定需求的音乐,成为了近年来自动音乐生成的研究重点之一。本文以MIDI音乐为基础,设计了一种音乐数据的文本化表示方法,并将大型自然语言生成模型迁移到音乐生成中来,实现音乐的快速生成,最后设计出了一种融合数理统计和乐理知识的音乐评价模型
学位
随着无人驾驶技术飞速发展,无人驾驶汽车需要感知行驶环境完成自主驾驶,实现全面数字化。对此,本文提出基于交警姿态估计下的8个交通信号手势的识别。目的是发生道路堵塞、信号灯损坏时,无人驾驶汽车可识别交警信号手势做出相应措施。文中先对斑马线进行语义分割、二值化处理,通过统计连通区域个数(设定区域数大于1为交叉路口)判断当前路口是否为交叉路口。接着对交警站立朝向识别:其先利用Faster R-CNN识别交
学位
机器人应用在人们生产生活的各个领域,代替人进行一些复杂和危险的任务。因此,机器人的位置跟踪控制需要较高的精度。但是,由于机器人系统是一个非线性、强耦合的系统,受到各种不确定性的影响,如未建模动力学、测量噪声、负载变化、外部干扰、非线性摩擦、输入死区等。因此,需要一种结构简单同时又能确保跟踪性能良好的控制方法来控制机器人。时延控制以其结构简单、不依赖于系统模型的优点可以估计复杂未知动力学及难处理的非
学位
叠加信道估计方法由于具有高的频谱效率,得到了世界范围内专家学者的广泛关注。然而,训练序列与数据序列的叠加不可避免地引起叠加干扰,大大降低信道估计与数据检测的准确性。为消除叠加干扰,数据依赖叠加训练(Data-Dependent Superimposed Training,DDST)和数据空叠加导引(Data-NullingSuperimposed Pilot,DNSP)方法相继被提出,这些叠加方法
学位