【摘 要】
:
复杂背景下红外目标检测是基于红外图像,对多种复杂场景进行分析与理解,获取兴趣目标类别与方位的计算机视觉技术。当前,复杂背景下红外目标检测主要面临两方面的问题,一是缺少相关数据集,二是模型收敛速度慢、检测精度低。针对上述问题,本课题采用深度学习方法对复杂背景下的红外目标检测技术进行了深入研究,主要工作如下:(1)构建了针对红外目标检测的网络模型。检测网络以YOLO系列模型为框架,采用CSPDark
论文部分内容阅读
复杂背景下红外目标检测是基于红外图像,对多种复杂场景进行分析与理解,获取兴趣目标类别与方位的计算机视觉技术。当前,复杂背景下红外目标检测主要面临两方面的问题,一是缺少相关数据集,二是模型收敛速度慢、检测精度低。针对上述问题,本课题采用深度学习方法对复杂背景下的红外目标检测技术进行了深入研究,主要工作如下:(1)构建了针对红外目标检测的网络模型。检测网络以YOLO系列模型为框架,采用CSPDark Net-53作为特征提取网络,特征金字塔结构为特征融合网络。为使深度网络能够有效地学习到复杂背景下的图像特征,加入了高效聚合网络模块,同时引入了协调注意力机制。构建的模型有效提升了红外目标检测精度。采用红外图像数据集对构建的模型进行测试,实验结果表明相较于基准网络模型,各类目标平均正确率从34.9%提升至38.1%。(2)提出了复杂背景下的实例特征预训练方法。针对复杂背景下目标检测网络收敛速度慢的问题,该方法首先构造一个图像拼接模板,将输入图像重构为具有复杂背景的图像。然后采用重构图像,对特征提取网络进行预训练;最后借助迁移学习技术将得到的预训练模型加载到检测网络中。同时,在数据处理阶段引入了Mosaic数据增强技术,有效解决了训练数据缺乏的问题。实验结果表明网络模型收敛所需要的迭代次数减少为原来的一半,收敛速度得到有效提升。(3)进行了充分的消融验证与对比实验。消融实验由参数消融和模块消融两部分组成。通过参数消融确定了最优的网络模型参数;在模块消融实验中对每个模块进行消融训练,确定了模块对网络性能的影响。在对比实验中对比分析了本文模型与当前主流方法的红外目标检测性能。结果表明,本文模型对各类目标的现有检测精度均有提升,其中对行人正确率提升最明显,从77.2%提升至88.1%。
其他文献
新一代群智感知(Crowd Sensing)系统在完成大规模、细粒度感知任务的过程中,基于人工智能的分析、推理及决策的作用变得不可或缺,而且越来越重要。群智感知是一个依赖移动智能终端设备广泛参与数据感知计算的开放系统,很容易造成用户隐私数据泄露。联邦学习(Federated Learning,FL)是让一组设备协同训练一个共享的人工智能模型的新兴分布式机器学习方法,模型训练过程中将用户数据保存在用
得益于知识图谱技术的迅速发展和智能问答技术的逐渐成熟,普通的搜索引擎需要用户对链接进行二次筛选的问题逐渐得到了解决。本文借助于深度学习技术,以医疗领域为例搭建知识图谱,将用户输入问题到答案反馈这个流程拆分为三个阶段,从而形成以领域知识图谱为基础的问答系统,旨在整合领域知识,为用户提供简单快捷的信息检索服务。基于此目标,本文的主要研究内容包括以下三个方面:(1)首先,本文提出一种中文命名实体识别模型
随着感知与控制技术的不断进步,四旋翼无人机已被成功地应用于各种领域,如航空摄影、农业测绘、探测搜救、科学研究等,为日常工作和社会发展提供了强有力的支持。越来越多的科研机构开始利用四旋翼无人机开展特定的障碍物目标检测以及智能避障研究,这些研究既能提高无人机在飞行中的可靠性和安全性,又能避免无人机对人身和财产造成的潜在威胁。而数字孪生技术通过创建物理实体的虚拟镜像,借助数据、模型等模拟物理对象在真实环
随着智能设备的不断普及,人们在日常的生活中频繁接触图像。图像中包含大量的信息元素,人类可以通过将图像作为载体进行信息交流。在日常生活中我们使用手机或相机拍摄照片时,得到的图像不是单一时间内的一幅即时图像,而是一段时间内的情景,在拍照的过程中,相机会产生曝光,在这短短几秒里,所拍摄的物体产生位移或照相机自身发生了位移都可能会导致像素点发生错乱,产生一种非均匀模糊,造成图像信息受损而无法传递有效信息。
随着无线通信技术的蓬勃发展,无人机影像应用是继卫星遥感的有力补充,目标检测技术在无人机航拍场景的应用也成为理论界焦点话题。然而,无人机航拍与计算机视觉的结合虽然予以生活极大地便利,但是仍面临以下问题亟待解决:如何避免在无人机航拍视频中行人检测时出现漏检和错检;如何在行人之间出现相互遮挡以及在不同的光照条件下进行检测。常见的目标检测算法在对自然场景下具有较好的检测效果,但是对于无人机航拍中的目标检测
在当前的嵌入式多核系统中,存在着大量的任务需要计算和处理,例如无人驾驶汽车系统和大型工控设备中各个控制模块的任务,这些任务之间存在着复杂的约束关系,而DAG任务模型常用于描述这些任务之间的关系。DAG任务模型的调度算法也可以应用于多核系统中,为了缩短系统中任务整体的完成时间,对于DAG任务模型的调度算法研究就成为了一个关键问题。针对带有通信开销的DAG任务图,现有的基于任务复制的调度算法存在数据冗
无人机编队作为军事和民用领域的一种常用复杂装备,如何智能、精确地协同控制编队是一个重要的研究方向,但现有的无人机编队实验大多采用仿真实验,在实际飞行中存在可靠度低,安全性差等问题。数字孪生技术作为一种新兴技术,在实验验证时将实际对象的状态数据纳入测试过程,在智能运维、异常诊断、风险预测和决策辅助等方面表现出诸多应用价值,受到世界各方的关注和讨论。本文将数字孪生技术引入无人机编队的智能协同控制研究中
随着各种类型的室内服务机器人被广泛应用在人类的生活生产中,机器人的同步定位与建图(Simultaneous Localization and Mapping,SLAM)技术逐渐成为研究的热点。受室内环境多样性与复杂性的影响,基于二维激光雷达的SLAM由于只能获取安装高度的障碍物信息且回环检测困难,从而不能构建障碍物信息完整的高精度环境地图。因此,论文针对单一二维激光雷达SLAM在室内环境中存在的问
社会保险作为社会保障制度的重要组成部分,与每个人的生活息息相关。而随着互联网的发展,人们对社会保险的关注度越来越高。如何在纷繁杂乱的数据海洋中快速获取社会保险知识成为人们迫切需要解决的问题。最近的研究中,知识图谱由于能够直观便捷的构建结构化知识体系而备受关注。而实体关系抽取能够从非结构化的文本中抽取结构化的知识表示,所以在知识图谱的构建过程中具有重要意义。因此,基于实体关系抽取的社保领域知识图谱构
随着数字化技术的发展,使用手术导航系统协助医生便捷精准地进行手术已经成为了一种重要的发展趋势。而注册技术是实现手术导航精准定位的关键,通过注册技术可以获得真实患者空间与虚拟图像空间的转换关系,使两者坐标系得到统一,实现虚实结合。目前,手术导航的注册方式主要分为:基于标记点和基于无标记点。其中,基于标记点的注册方式存在着标志物掉落、遮挡、无法识别等问题。为了避免以上缺陷,本文在研究方法上采用了基于无