基于聚类与分形的图像几何特征在目标检测算法中的研究

来源 :东华大学 | 被引量 : 0次 | 上传用户:afuren1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测是计算机视觉领域一项非常重要的任务,其实际应用包括自动驾驶、医学影像分析、遥感图像检测等众多领域,在人类的生产生活中发挥着重要的作用。最近几年由于深度学习技术的加持,目标检测算法的发展进入到快车道,科研人员基于不同机制、面向不同任务设计出众多准确度与速度不断优化的目标检测算法。本硕士学位论文从提高目标检测算法性能的角度出发,以目标检测算法细分模块为切入点,充分利用图像几何特征对目标检测算法细分模块与整体进行创新与改进,致力于获得更高的性能。本论文的主要研究内容包括:(1)设计了基于密度峰值聚类的非极大值抑制算法,此算法基于未经非极大值抑制算法处理的候选框中心点簇状分布,通过基于自适应截断距离的密度峰值聚类对每个候选框进行信息增维,再通过采用自适应交并比的双步非极大值抑制算法输出最后结果。我们将此算法替换原版的非极大值抑制算法部署到多个目标检测算法上进行对比试验,在定性分析中证明了此算法再复杂场景下相较于原版非极大值抑制算法具备更强区别不同物体的能力,在定量分析中证明了此算法相较原版非极大值抑制算法有着更高的检测精度。基于密度峰值聚类的非极大值抑制算法具备通用性,可以在不重新训练模型的基础上实现性能提升。(2)设计了基于希尔伯特分块的周期位置编码算法,为Transformer在计算机视觉中的应用提供了性能更好的图像数据序列化算法。由于Transformer在将二维图像序列化时存在对图像物体结构的破坏现象,本文创新地将分形几何引入到图像数据序列化中,充分利用图像内物体的几何分布,设计出基于希尔伯特曲线的分块方式以及与之周期特性相契合的位置编码算法。本文将基于希尔伯特分块的周期位置编码算法部署在分类模型ViT与目标检测模型DETR上,通过对比实验发现此算法训练时能够明显加快网络收敛速度,训练完成的网络在分类精度与检测精度上都有提升,证明了此算法的合理性,为后续位置编码算法的研究提供新的思路。(3)设计了基于图像几何特征的DETR,我们分别在通用目标检测和主流军用飞机检测领域进行了应用。本论文将基于希尔伯特分块的周期位置编码算法与基于密度峰值聚类的非极大值抑制算法替换原版DETR算法相对应的模块,形成基于图像几何特征的DETR。我们使用MS-COCO数据集预训练了基于图像几何特征的DETR、三个基于卷积神经网络的目标检测算法与原版DETR,在通用数据集上的对比试验证明了基于图像几何特征的DETR有着较高的检测精度。本论文为了验证基于图像几何特征的DETR实际应用效果,自建了一套难度较大主流军用飞机检测数据集,与上述四个目标检测网络一起使用通用数据集的预训练模型进迁移学习。本论文经过定性试验发现了基于图像几何特征的DETR有更好的对复杂场景物体区分能力,经过定量试验结果发现了基于图像几何特征的DETR在主流军用飞机数据集上有更高的检测精度,以上结果证明了基于图像几何特征的DETR有着较好的实际应用能力。
其他文献
逆合成孔径雷达(Inverse synthetic aperture radar,ISAR)可以对非合作机动目标进行成像,对目标的分类和识别具有重要作用,近几十年来获得了许多学者的关注。随着技术的进步和发展,单站ISAR成像逐渐朝着高分辨率,实时性方向发展。但是单站ISAR存在以下缺陷:一是无法对沿雷达视线方向运动的目标成像。二是对非合作目标成像,将导致复杂的平动补偿问题。三是难以对隐身目标成像。
学位
深度学习是幼儿通过解决问题、动手操作、主动参与进行深入新旧知识的交流与建构。幼儿园户外自主游戏在更大限度上给予幼儿自由选择游戏与同伴的机会,但是目前户外自主游戏活动区域狭小、教师对深度学习缺少深入理解、活动目的性不强、游戏时间不足,难以促进幼儿的深入探索与成长。因此幼儿园应充分注重提供充足的空间与材料、教师加强深度学习、突出活动目的性、给予更多的游戏时间、注重家园合作,结合深度学习的理念在户外自主
期刊
近年来,随着全捷联探测技术的应用,精确制导武器正朝着低耗费、低重量等趋势发展。由于捷联导引头导弹去除了传统的惯性平台,导引头得以固联于弹体上,为导弹实现低成本化和轻型化提供了可能,但与此同时也带来了很多新的问题,如制导算法过于依赖惯性系下的制导信息、体视线角受弹体姿态运动影响剧烈、目标易超出导引头视场范围、制导信息和姿态信息存在耦合等。本文针对捷联导引头导弹的制导控制算法展开了一系列的研究。首先,
学位
现代战争形态的深刻变化导致越来越多的智能机器人深度参与到战争的各个环节,地面移动机器人承担的任务也随之越来越繁重,因而要求具备更好地环境适应性、地形通过性,同时也需要根据任务种类灵活搭载不同的任务载荷。基于轮辋变形创新设计的轮、履、腿复合多运动态移动机器人具有广泛的应用前景,但其底盘控制节点更多、实时性要求更高、环境感知能力要求更强,可以搭载的侦察、排爆等任务载荷种类更多,传统CAN控制网络的带宽
学位
为了解宁波市“三江”干流水质水生态现状,在“三江”干流沿途布设16个水质水生态监测点,采用自动化仪器搭载测量船方式对水质水生态指标进行监测及分析。从水质指标监测结果来看,余姚江干流总体水质较好,奉化江、甬江干流为咸水,除部分断面溶解氧、浊度超标外,其他指标值均在标准范围内。从水生态指标监测结果来看,“三江”干流原核微生物丰富度较高,真核微生物整体丰富度偏低、多样性维持在较高水平。Beta多样性分析
期刊
<正>多式联运“一单制”指多式联运经营人向托运人签发一份多式联运全程提单,并由区段承运人根据运输要求依次完成相应作业。多式联运“一单制”可以解决多式联运业务中存在的各种运输方式间作业规则和单证不统一、不标准的问题,在货主、货运代理人、区段承运人、多式联运经营人、基础设施运营商等利益相关方之间实现多式联运信息共享,
期刊
高温碳化炉作为加热炉的一种,其典型特点是存在时滞、非线性、参数时变、系统不确定性以及炉内环境恶劣等问题,严重恶化了碳化炉系统的温度控制过程。为了实现精确、快速、稳定的温度跟踪性能,以碳纤维生产线中的高温碳化炉为研究对象,研究碳化炉温度的先进控制系统,主要研究内容和创新点如下:1、本文利用热量守恒定律,建立了温度动力学模型,并将其简化为一阶加纯滞后(FOPDT)模型,又使用基于模型推导的含有滞环的偏
学位
近年来,随着科学技术的飞速发展,人们对于高速数据流的需求越来越大。与此同时,高速数据流也正在快速增长。更重要的是,为了支持未来高速无线通信的速率要求,迫切需要新的物理层解决方案,其中毫米波(28GHz-300GHz)被认为是最有前途的频段之一。与微波相比,毫米波频谱由于其带宽大、数据传输速率快,给未来的快速通信提供了巨大的潜力。本文首先针对室内狭长信道模型,即室内长走廊信道进行仿真,比较了视距(l
学位
期刊
近年来,深度神经网络已被广泛应用于三维点云的处理与分析。然而,现存的针对单物件点云的语义级和实例级分割网络仍存在对三维物件的几何多样性特征难以有效学习的问题。为同时实现三维点云的语义分割与实例分割,本文设计了一个新的针对物件点云的语义与实例分割深度学习网络,并通过实验验证了网络的有效性和优越性,也进行了领域拓展应用,在多种点云场景下验证了其适普性。主要贡献如下:(1)本文提出了一种以动态图卷积为基
学位