基于深度学习的海上人体目标检测技术研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:gongwen_2003
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在大范围的海上搜寻过程中,海上人体目标存在尺度小、特征弱的特点,导致海上搜寻存在难度大、效率低等问题。本文将基于深度学习的目标检测技术应用在海上搜寻领域,选择以既能保证较高检测精度,又能满足实时性的YOLOv3算法为基础,通过对小目标检测的研究对该算法进行改进,提出一种海上人体目标检测技术。本文主要工作如下:1.提出一种基于YOLOv3算法改进的小目标检测算法。使用Efficient Net网络中的残差结构构成的特征提取网络代替原算法中的Dark Net-53网络。通过对小目标在回归过程中可能遇到问题的分析和对检测算法损失函数研究,使用CIo U损失函数代替原算法均方误差表示的目标框损失,最后在VOC数据集上通过实验验证了改进算法的有效性。2.制作了包含大量海上人体目标的数据集。在海边进行数据集图像的采集,并主要对图像中的海上人体目标和陆上人体目标进行标注,制得海边人体目标数据集,该数据集为检测模型的训练奠定了基础。3.为继续提升小目标的检测性能,对特征融合网络进行了研究,并通过实验验证了使用PANet网络代替YOLOv3算法中的FPN网络在自制的数据集上得到的检测效果更好。在锚框的设置方面,针对自制数据集通过聚类算法生成的锚框存在的不足,使用一种线性变换方法对聚类生成的锚框进行处理,最后通过实验验证了使用变换后的锚框能进一步提升海上人体目标的检测效果。本文通过制作包含海上人体目标的数据集,使用新的特征提取网络和PANet网络构成的卷积神经网络作为检测网络,针对海上人体目标,使用CIo U损失函数作为目标框的损失,并使用一种线性变换的方法对在自制数据集上聚类生成的锚框进行优化,在YOLOv3算法的基础上,海上人体目标的检测精度提升近13%,同时降低检测模型的参数量,加快检测的速度,有效地改善了海上搜寻存在的问题,为海上人体目标的搜寻提供一种新的方法。
其他文献
随着互联网以及深度学习技术的快速发展,数据驱动模型越来越流行。当前,对于电商领域的对话系统,研究者往往聚焦于其内的对话数据。虽然此种方式能够解决对话系统中用户的高频问题,但是针对某些长尾型问题通常缺乏泛化以及语义理解能力,并且会导致对话系统生成的答复缺乏流畅性和多样性。BERT预训练语言模型在自然语言理解任务中展现出了先进的泛化和语义理解能力。但是,由于BERT模型双向编码的特点,导致在答复生成任
学位
为有效缓解某电厂660 MW机组前后墙对冲燃烧锅炉两侧墙水冷壁高温腐蚀及煤粉颗粒冲刷磨损问题,结合高温腐蚀的原因及机理,并根据现场设备情况,提出将靠近两侧墙的旋流燃烧器角度向炉内中心偏转3.5°。对燃烧器偏转前后的锅炉燃烧进行数值模拟,对比分析了燃烧器角度偏转前后的温度场、速度场、浓度场以及颗粒轨迹的变化,并将方案进行了工程应用。数值模拟和工程应用结果表明:燃烧器角度偏转后,炉内气流向炉膛中心集中
期刊
骨质疏松症是由于多种原因导致的骨密度和骨质量下降,骨微结构破坏,造成骨脆性增加,从而容易发生骨折的全身性骨病。该病症近些年来在以百万的数目逐年增加。医学上用来诊断该病症的辅助手段一般为CT、MRI等医学影像技术,这类技术通常会从不同角度对识别对象进行多方位断层切片成像,因此具有三维空间结构信息。而目前大多数的医学图像分析都局限在二维的检测方式,一定程度上摒弃了空间信息,极有可能出现判断的偏差。本文
学位
视觉问答任务是目前机器学习领域中较为热门的一个研究方向。在视觉问答中,研究人员采用注意力机制或者单个图神经网络来建模图片中物体的属性及其关系,从而引入推理信息。除此以外,研究人员为了在模型训练过程中引入多种推理信息,构建了多个图神经网络。然而随着更加复杂的视觉问答数据集的提出,数据集中的图片存在大量物体及其属性,问题呈现出组合式语言,同时图片中的物体与物体之间存在纷繁复杂的关系。因此,如何从具有众
学位
分子的性质预测任务,即根据分子的结构和组成预测出它的诸如水溶性、毒性等各项自身理化性质的任务,被广泛运用于药物发现、新材料研发等领域。近年来,机器学习方法越来越多地被用于分子性质预测任务,大大降低后期工艺失败的负荷,节省大量的资源和时间。然而现有模型一方面忽略了分子子结构的空间位置信息,难以区分结构很相似的子结构,另一方面,由于现实的分子无论空间上如何旋转,分子本身构象如何不同但若是原子间作用不发
学位
目的:通过整理漳州市某院门急诊处方,对点评结果进行分析,提出改进方法,促进合理用药,保障用药安全。方法:回顾性分析2021年1-12月抽样处方点评结果。结果:共抽样点评2021年1-12月门急诊处方15399分,不合理处方共449份,平均合理率为97.08%。其中不规范处方(临床诊断书写不全)275份;不适宜处方共173份(适应证不适宜15份,用法用量不适宜96份,遴选药品不适宜49份,联合用药不
期刊
目的:分析西药门诊中应用处方点评的干预价值。方法:选取本院2019年1月至2022年2月门诊应用西药处方治疗的220例患者为研究对象,按照随机数表法将患者分为对照组与观察组,各110例。对照组采用常规处方管理方法,观察组采用处方点评管理方法,比较两组处方用药不合理情况。结果:观察组联合用药不合理、药物剂量与用法不当、药物重复使用、药物与诊断严重不符、抗菌药物等级过高发生率均高于对照组,组间比较,差
期刊
随着智能手机的普及,微博、推特等社交媒体的用户量迅速增长,社交媒体中每天都会产生大量结构化与非结构化数据。然而,这些数据具有高度异质性并且包含了大量噪声,用户很难直接从中获取有价值的内容,所以协助用户在海量社交媒体数据中寻找有价值的信息有重要意义,本文基于社交媒体数据本身存在的大图结构提出一种社交媒体图可视分析方法,帮助用户在大规模社交媒体数据中获得一些关键信息。本文主要研究内容如下:首先,本文提
学位
随着大数据、移动互联网和社交媒体等技术的发展,网络空间中所蕴含的文本数据量呈指数级增长。因此,如何对这些文本数据进行分析并挖掘出有价值的内容(例如术语、实体、关系等)成为当前备受关注的研究领域。其中,从文本集合中抽取出描述某一特定领域(例如生物学、社交等领域)的术语是文本挖掘和信息抽取等领域的关键基础问题和研究热点。本文主要研究内容如下:首先,设计了一个自动术语识别框架,其可以动态扩展现有的自动术
学位
随着医学影像种类和数量大幅增加,对于医学图像自动识别辅助诊断的需求也急剧上升。本文将生成对抗网络GAN(Generative Adversarial Networks)应用于医学图像融合和检测,提出了适于医学图像融合和检测的GAN神经网络。主要工作和成果包括:(1)提出了一种基于GAN的医学图像融合方法。将传统的GAN模型改造成双输入单输出的模型。生成器采用六层卷积神经网络架构,删除下采样层以保证
学位