基于机器视觉的水面目标识别的研究及应用

来源 :上海海洋大学 | 被引量 : 0次 | 上传用户:zhanglangsdkd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着对河道、湖泊及海洋更深入的开发利用,水面设备的数量和船舶使用量也随之增加,加上现在环保意识不强,进而伴随着水面垃圾增多而导致污染、水面设备和船舶过多而导致航行事故等情况频繁发生。船舶识别、常见垃圾和海洋设备的识别可以为垃圾清理和船舶交通监测等应用提供研究基础。因此如何识别出垃圾、水面设备和行驶船只,对环境和水面交通的治理有着很重要的意义,因此有非常大的研究价值。基于深度学习的相关机器视觉技术在自动驾驶汽车或者无人机领域取得很大进步。然而,在水面目标识别方面的相关研究还是较少,现在仍旧停留在利用传统机器视觉方法进行目标提取,场景比较单一,算法难以工程化。目前在水面目标识别领域中对深度卷积神经网络的研究较少,将何种深度学习算法应用于水面目标识别还有待进一步的研究,因此本文对深度学习相关知识进行了研究,选取工程化使用率很高的三种深度卷积神经网络算法faster R-CNN、SSD和yolov3作对比实验。即对于同样的水面目标训练集和水面目标测试集用不同的算法作对比,选取最适合的水面目标识别的深度学习算法。经过水面目标的识别率和识别速度的结果对比,得出yolov3算法优于前两者的结论。然后通过对yolov3算法的网络结构和损失函数等的进一步研究,更深度优化该算法,使其在水面目标识别中识别效果更好。同样,本文将改进前后的yolov3算法也进行一个对比实验,得出改进后的yolov3算法识别率更高,训练时的收敛速度也更好的结论。在选定yolov3算法后,需要对水面数据集进行数据增强处理,使后面算法研究的效果更好。通过采集大量的可训练数据构建水面目标训练集和测试集,采用随机旋转、随机亮度和对比度、添加噪声等数据增强技术模拟出不同天气条件,比如强光或者傍晚等,既增加训练数据的多样性又增加数据的数量,同时也可以增强算法的泛化性,提高识别率。此外在构建更为丰富的水面目标数据集时,采集不同角度、不同场景的数据,增强训练结果的有效性。为了增加水面目标识别的速度,研究了在多种水域情况下进行水域分割的算法。由于水面目标识别的特殊性,一般情况下水域区域并不占据识别图像的整个画面。但是在常规算法推理的时候,是需要在整个画面进行候选框筛选。其筛选候选框占用算法运行时的很大一部分目标检测时间,因此本文提出的水域分割算法可以大致分割出水域区域,让目标物底框不在水域区域内的所有候选框都排除掉,这样可以在很大程度上减少候选框的个数,提高算法的推理速度,有助于算法的工程化应用。本文基于此现象,提出三种水域分割算法。首先基于海天线识别的水域分割算法可以适应于海天线比较明显的海域中,此时画面比较开阔,可以利用此算法通过提取海天线的算法来获取水域区域。针对比较清澈的湖泊,提出基于相位相关性算法的水域分割算法。因为此水域中有明显的倒影,可以利用倒影与实物的相位相关性求出水岸线,进而获取水域区域。前两种算法在特殊水域中,可以快速反应,获取水域区域。但是在一般性水域的识别性较低,因此本文提出第三种水域分割算法,基于区域分割的水域提取算法,此算法利用基于标记的分水岭算法将水域提取出来,对待复杂水域情况下识别效果优于前两者。本文除了对算法本身进行研究,在算法进行有效性验证方面和工程化应用方面做了一定的研究。首先利用算法对经过数据增强的自制水面目标数据集进行训练,记录训练过程中的loss值和IOU变化率等训练中间结果,然后对其进行分析,进而分析算法训练的有效性和观察收敛的程度是否和理论预测相同。最后用训练后的权重文件进行测试集验证,对比不同情况的识别结果。最后将训练后的权重文件在无人船上进行工程化应用。首先改造无人船系统,进行无人船控制。无人船上搭载海康摄像头、激光雷达、esp8266等设备,进而搭建出一个局域网,进行无人船与上位机的通信链路。随后将算法应用到该无人船中,进行水面目标识别应用。通过实验证明,本文所设计的目标识别算法在水面目标识别方面有比较好的识别效果。
其他文献
熟知英语教学史的人都知道,二十世纪是英语教学法出现最多的世纪。在理论上,英语教学法已经形成一门完善的学科。在实践中,它也有一支一直在不断扩大的实践队伍。其理论研究的成果在指导英语教学实践方面起着重要的作用。英语教学法理论的不断变换促进了英语教学法的变换。然而,在二十世纪末,美国著名应用语言学家库玛提出,外语教学已经进入后方法时代。他认为单纯的使用某一种外语教学法进行外语教学已经不符合时代的要求。为
随着社会科学的进步,土木工程领域也在发生巨变,涌现出各种大型复杂的结构,由于外界环境的复杂和使用过程中各种人为因素,结构在服役过程中不可避免会出现损伤。土木工程结构较其他工程结构存在尺寸大,质量重的特点,若不能及时对结构损伤进行检测和维护,当损伤累积到一定程度会导致其丧失服务功能,严重时会给人民生命和财产带来巨大伤害,所以研究结构损伤识别方法,对减少工程灾害的发生和降低维护费用具有非常重要的理论和
关系抽取是自然语言处理的关键基础任务之一,其目的是从自然语言文本中识别出两个实体间所存在的语义关系。目前关系抽取方法主要分为有监督、无监督和远程监督三种,其中,远程监督基于“包含相同实体对的句子都在表述实体对在知识库中的对应关系”的假设,解决了人工标注语料费时费力的问题,成为关系抽取的重要研究方向之一。虽然远程监督可以快速获取大规模语料,但是却不可避免的产生错误标注问题。多示例学习的引入和深度学习
随着知识成为21世纪市场竞争最有利的资源,大型建设工程项目团队对于知识学习越来越重视,大型建设工程项目本身具有历时长、环境复杂、组织团队临时性、人员来源跨组织,专业
随着科技的进步和人类认知的不断加深,复杂网络也越来越引起研究者的兴趣.本文中,我们研究了几类网络分别为一类加权无标度网络,顶点—顶点图,一类迭代的加权自相似剖分网络
从能源及可持续发展角度,催化选择性氧化过程具有重要的工业应用前景。通过环己烷选择性氧化制备的环己醇和环己酮的混合物(KA油)是重要的化工中间体和石油化工原料。然而,工业
现在计算机能够对图像进行更快更深层次地分析与处理,这意味着数字图像可以提供更多的信息。人们可以通过机器自动理解和分析图像或视频内容来改善人们的日常生活。但与此同时,人们也希望自己的隐私不受到侵犯,因此如何在二者之间取得平衡,这对于许多实际应用来说是亟待解决的问题。针对此问题,通过对图像中的视觉隐私信息进行合理的分析与处理,能够在一定程度上消除图像视觉隐私威胁并保持图像满足要求的可视性和机器可理解性
信贷是解决我国牧区贫困问题的重要政策手段,尤其是自我国提出“精准扶贫”的战略目标后,信贷作为帮助牧民创造多样化生计来源的主要金融手段而被推动,因此,牧民的信贷行为及
我国南方亚热带旱地红壤由于亚热带季风气候以及人为因素退化严重,土壤肥力低,生物多样性降低和逐渐酸化。针对这一现象,向旱地红壤中有机畜禽粪便(有机肥)能有效地解决这些问题,但有机肥的施用会增加土壤CH_4、N_2O排放,向有机肥(动物粪便)堆肥中添加生物炭以及把这种生物炭-有机肥堆肥混合物施入到土壤中,可提高作物产量和减少CH_4和N_2O排放,具有重要的实用价值以及应用前景。鉴于材料对生物质炭的影
随着全球经济的高速发展,化石能源的消耗造成了能源的枯竭以及严重的生态污染,而氢能具有绿色清洁、储量丰富以及可循环利用的特点,深受世界各国的重视。其中,金属氢化物储氢