基于深度学习的水下目标检测方法及其应用研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:xhb876
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习方法及其目标检测方法的飞速发展,它们的应用范围越来越大,特别是在水下目标检测、海洋环境探索、水底生态保护、渔业养殖辅助等方面正在发挥着越来越重要的作用。但是,由于水下环境比起陆地上的环境要复杂很多,光在水中传输时又会受到水的吸收、反射和散射等影响而发生严重的衰减,因此采集到的水下图像难免会出现可见范围有限、模糊不清、色彩不协调及噪声等各种问题。另外一方面,由于水下生物数量和种类繁多,部分水下生物的体积较小,所以在水下目标检测过程中极为容易出现遗漏或误判。因此,把深度学习方法及其目标检测方法应用到水下环境的目标检测和探索是十分有必要。本文针对上述的问题,采用深度学习方法对目标检测算法进行深入的研究和改进,使其在水下环境探测任务中有更优良的性能。本文的主要研究内容包括以下几个方面:(1)提出了一种基于改进Faster RCNN的两阶段水下目标检测方法。将Faster RCNN(Regions With CNN Features)的特征提取模块由原来的VGG16替换成Res2Net101,其结构能增强网络层感受野的表达能力。引入OHEM(Online Hard Example Mining)算法来解决候选先验框的正负样本的不均衡问题。最后使用GIOU(Generalized Intersection Over Union)和Soft-NMS(Soft Non-Maximum Suppression)对先验框的机制进行优化。(2)提出了一种基于改进YOLOV4的单阶段水下目标检测方法。首先通过相关的聚类算法对数据集中的先验框进行聚类,选出训练模型先验框的初始值。对主干网络加以完善,添加深度可分离卷积,提高网络的特征提取能力;接着将注意力机制模块Eca-Net添加到SPP(Spatial Pyramid Pooling)模块当中,通过适当的跨信道交互,显著地减少模型复杂性,以提升其效能。然后为了提高模型对小目标的检测性能,增加了一个预测层;最后改进训练策略,使用多尺度训练策略,使得改进后算法模型有更好的鲁棒性。(3)为了检验和验证及完善和提高上述算法的性能,本文在上述改进算法的基础上,研究和开发及实现了一款智能单阶段水下目标检测系统。该系统包含Web端后台管理平台和智能水下目标检测管理平台。两个平台相互协作,以完成水下图像目标检测、对图中生物数量的统计、查看历史数据、系统监控等各项功能和任务。
其他文献
人脸识别技术已经成为日常生活中应用最广泛的身份认证方式,但是人脸信息极易泄露,攻击者仅通过成本较低的打印攻击或视频重放攻击就有可能攻破人脸识别系统,相关事件也时有发生,给人脸识别系统的安全应用带来了极大的挑战。目前业界先进的人脸反欺诈算法借助深度学习技术实现了非常好的欺诈人脸检测效果,但是他们都只考虑如何提高欺诈人脸检测效果,为此他们提升了网络的大小,引入了RGB模态之外的信息和时序信息。这些方法
学位
热休克蛋白A6(heat shock protein A6,HSPA6)是HSP70家族中的一员,属于严格诱导表达型基因。HSPA6基础表达水平较低或不表达,当在特定应激源的刺激条件下,其表达水平会迅速、显著升高。相对于HSP70家族的其它成员,关于HSPA6基因的研究较少,目前针对HSPA6的转录调控序列元件及调控机制方面的研究仍有待完善。近期关于该基因启动子序列的分析结果表明,在转录起始位点-
学位
三维网格模型的轮廓渲染(描边)有着广泛的应用。基于CPU的描边算法,虽然能实现较高级的风格化处理,实现,但只能离线渲染,无法达到实时。而基于GPU的实时加速算法又往往受限于GPU的并行特性,不得不牺牲部分高级风格化效果。其原因在于这些实时算法都无法将轮廓元素(网格边或是屏幕像素)链接(矢量化)成线条。本文提出了一个基于GPU的实时网格轮廓渲染方法,包含如下几个环节:首先,从三维网格模型中提取轮廓线
学位
随着半导体工艺技术不断提高,芯片设计规模也在不断增大,特别是基于IP复用的设计方法学被提出,越来越多的处理器、存储器等都集成到系统级芯片中。为了满足设计规模越来越大的验证需求,提高验证效率就显得非常重要。基于System Verilog的UVM(Universal Verification Methodology)的提出,大大提高了验证工作的效率,因此成为业界验证的主流。然而从EDA验证框架角度考
学位
甲型流感病毒(Influenza A Virus,IAV)是单股的负链RNA包膜病毒,属于正黏病毒科(Orthomyxoviridae),因为其传播速度和变异速率很快,且致病率和致死率都较高,一直严重威胁着人类和动物的健康及生命安全。环状RNA(Circular RNA,circ RNA)是一种闭合的环状非编码RNA(Non-coding RNA,nc RNA),作为一种重要的表观遗传调控因子,c
学位
Kirsten rat sarcoma viral oncogene homolog(Kras)是一个编码小GTP酶转导蛋白KRAS的原癌基因,目前的研究表明,KRAS能够促进细胞因子分泌、细胞存活和趋化性。然而,KRAS对前体脂肪细胞分化和脂质蓄积的具体作用目前尚未有相关报道。因此,本研究使用si RNA敲降Kras的表达水平,探究其对3T3-L1和C2C12细胞增殖、自噬、成脂分化和脂质蓄积的
学位
随着人们生活水平的不断提高以及对健康观念的日渐重视,国民对乳品质要求越来越高,需求量也越来越大,富含营养成分的高品质牛奶以及奶制品衍生物受到了人们的青睐。在我国过去的十几年中,通过饲料营养调控改善牛奶成分和提高奶牛产奶性能的研究越来越受到重视,尤其是改善牛奶的蛋白质和脂肪酸组成成为研究的亮点。乳腺上皮细胞可以合成几乎所有的中链和短链脂肪酸(MCFA和SCFA)、α-酪蛋白和β-酪蛋白。酪蛋白是乳蛋
学位
二甲苯是一种工业生产中广泛使用的溶剂与重要的化工原料,因此生产中残留的二甲苯容易进入随产品进入到人们的生活中。二甲苯具有刺激性与致癌性的特点,在2017年被世界卫生组织列入三级致癌物。环境中少量的二甲苯和甲苯已知会使得接触的眼睛、鼻子和皮肤部分发炎并诱发如头痛、疲劳等等类似的症状。随着人们生活水平的提高,对健康问题的关注更加深入。由于金属半导体气体传感器对大气中住宅里的致癌物质的监控,有着操作便捷
学位
随着经济的发展和移动互联网的普及,电子商务的规模不断扩大,物流业也得以迅速发展,已经成为了推动国家经济发展的基础性产业,但同时也存在物流运输费用较高的问题。而且伴随着城市化的不断加深,城市配送已经成了整个物流配送体系中成本最高的一环。结合现代信息技术,优化车辆配送路线可以有效降低运输成本,这不仅能提高企业的竞争力,也有助于提高经济效益。对于路径优化问题,过去的研究主要集中于启发式算法,但随着问题规
学位
图像平滑旨在过滤图像中不重要的纹理同时保留有意义的结构,它是许多视觉和图形应用的重要组成部分。边缘强度和图像尺度是图像平滑中的两种重要线索。边缘强度编码了局部像素值之间的差异,可以区分不显著的细节纹理和显著的图像结构。图像尺度编码了纹理及结构的先验:纹理通常在较细尺度,而边缘和结构往往在较粗尺度。在过去的数十年,边缘感知滤波成为了图像平滑领域的一种主流思想,这种思想也被直接或间接地用于近年流行的基
学位