基于深度强化学习的船舶智能避碰方法研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:gkhksmq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着海上交通逐渐向高速化、密集化、复杂化发展,传统船舶避碰技术往往不能及时正确地处理复杂的船舶会遇问题,船舶碰撞事故仍频繁发生,造成重大危害与巨大的经济损失。据统计,船员在执行避碰决策时未按照国际海上避碰规则(COLREGS,以下简称避碰规则)行动是导致船舶碰撞事故发生的主要原因。当前避碰规则是基于人为协议建立的,对于某些避碰规则条款的解释具有一定的开放性,难以做到统一标准。针对船舶避碰技术存在的问题,建立具备处理多种会遇场景决策能力的智能避碰决策系统已成为各国的重要研究课题。为减少因人为操作不当导致的船舶避碰事故,提高船舶航行安全性,本文提出一种基于深度Q网络(Deep Q Network, DQN)强化学习算法的船舶智能避碰方法。本文主要内容包括:
  (1)提出基于强化学习的船舶避碰模型设计准则。梳理了船舶避碰决策过程,并给出了船舶会遇态势划分模型与船舶安全会遇距离模型;简要介绍了强化学习算法基本原理,结合船舶避碰特点提出了基于强化学习的船舶避碰面临的问题。在对避碰规则充分理解的基础上,提出了避碰规则量化评估标准,并分别从避碰决策实时性、遵守避碰规则、恢复航向三个方面提出基于强化学习的船舶智能决策应满足的设计准则。
  (2)构建基于DQN的船舶智能避碰模型。通过实时采集船舶航行状态信息,结合船舶碰撞紧迫程度、航向偏移的测算值以及会遇态势判断结果等要素,从全局角度设计船舶智能避碰DQN状态集。分析船舶航行特点,并结合避碰规则量化评估标准,分别从“航向保持”和“船舶避让”两个角度对船舶智能避碰DQN奖励函数进行设计。最后梳理基于DQN的船舶智能避碰算法实现流程。
  (3)基于船舶DQN智能避碰算法进行避碰仿真验证。分别针对两船的多种会遇局面与多船会遇场景进行数值仿真实验设计,根据DQN算法收敛效果与船舶仿真轨迹结果分析表明,本文提出的船舶智能避碰方法可以较好地完成复杂的避碰任务。
  本研究基于深度强化学习理论,在充分理解避碰规则的基础上提出了一种基于DQN船舶智能避碰算法,拓展了船舶避碰智能化的研究思路,可为船舶智能避碰技术的研究提供参考。
其他文献
视频监控设备已被广泛应用于海事监管与服务领域,在船舶交通流量统计、船舶异常行为监控等任务中发挥着重要作用。在复杂天气条件下对运动船舶目标进行实时检测和智能跟踪,是促进海事监管效率提升的重要基础。但因光线变化和水面波动等因素的干扰,传统方法普遍存在计算速度慢和鲁棒性弱等问题,难以对运动船舶目标进行实时和高精度检测与跟踪,无法满足实际场景的应用需求。为解决该问题,本文将在分析原始YOLOv3算法不足的
学位
随着社会经济的发展,海洋的价值也越来越被人类重视,水下自主式潜航器的(Autonomous Underwater Vehicle,AUV)的出现为人类探索、开采海洋资源提供了新的解决途径。然而,由于水下海底地形复杂多变以及受AUV续航性、操纵性等自身性能的限制,致使AUV在执行探测任务时的安全性难以得到保证。  AUV路径规划研究作为AUV研究领域的重要组成部分,能够有效地解决这一问题,并提高其航
随着我国经济的快速腾飞,国内的港口建设区域不断向外海发展,因此,我国在国外的港口项目日趋增多。这些直接面向大洋的开敞式港口,常年遭受长周期波浪的侵袭。目前,国内航道设计规范的参数多是基于短周期波浪环境中的计算结果,而对长周期波浪环境中相关设计参数的研究有待于深入探讨。海洋中的波浪复杂多变,导致船舶在波浪中的流固耦合运动相对复杂,且波浪的波幅(波高)、波频(波周期)、波长、波速和波向角等参数均会不同
学位
随着全球气候变暖,北极地区冰雪融化速度加快,北极地区形成了可通航的航道。北极航道是穿过北冰洋,连接大西洋和太平洋的海上航道,目前可分为东北航道、西北航道和中央航道。东北航道作为连接欧洲和东北亚之间新的海上运输通道,很可能成为从东北亚到欧洲的最短航道,航行时间可比途经苏伊士运河缩短30%~40%,其商业价值上的重要性是不言而喻的。但是船舶常态化航行在北极东北航道上,船舶安全航行需要高精度的定位和航向
学位
随着交通强国、“长江经济带”等国家战略的实施,长江黄金水道发挥着越来越重要的作用。近年来,长江12.5m深水航道的开通使得船舶大型化趋势迅速发展,进江船舶数量激增。而弯曲河段作为长江典型河段,因水流环境复杂多变、航道弯曲狭窄,一定程度上限制了船舶通航能力。弯曲河段流态复杂,船舶易受扫弯水、横流与回流等非正常水流推压偏离航线,驾引人员多采用人为操纵方式,过弯操纵难度及风险较大,人为失误造成的通航安全
随着“海洋强国战略”的逐步实施,航运业取得了巨大的发展,船舶避碰决策系统更加智能化,航海装备、航海技术也在不断升级换代。然而船舶碰撞事故仍时有发生,并且在船舶交通流量密集的繁忙水域经常会出现多船会遇的复杂局面。《国际海上避碰规则》并没有对多船的避碰行动给出具体的指导意见,致使在多船会遇局面下船舶避碰决策的制定具有较大的困难和不确定性。  为了保障多船会遇局面下船舶的航行安全,本文提出了一种基于分布
学位
随着我国“长江经济带”战略的全面实施和长江南京以下12.5米深水航道工程的全线贯通,内河船舶交通流量不断增大,船舶大型化趋势愈发明显,通航环境日渐复杂,导致水上交通事故的数量急剧增加,这对内河水上应急救助工作提出了更高的要求。在开展水上应急救助工作的过程中,应急资源发挥着至关重要的作用。科学合理地配置各类应急资源,不但能够提高应急救助的工作效率和服务水平,而且可以有效避免应急资源的闲置和浪费。面对
近年来,水上飞机在民用领域得到较快的发展,其与船舶之间的避让安全问题也越发凸显。由于水上飞机起降跑道多建于交通便利的港口水域附近,且所占水域范围较大,水上飞机与船舶出现在同一水域,使水上机场附近水域的交通情况变得复杂。  为保证水上飞机起降和船舶航行安全,在水上机场建设时,海事管理机关十分注重水上飞机起降跑道与船舶航道之间的间距问题。国内外现行的有关水上机场建设的规定和要求,仅对水上飞机起降跑道选
随着国家海洋强国战略和长江经济带发展工作的深入推进,水路运输在经济社会发展中的发挥着越来越重要的作用。水下地形勘探和测量作业是保障船舶航行及作业安全的基本条件,其需求日趋旺盛。传统水域测量作业主要由有人船艇搭载测量设备在作业水域往复航行实现,近年来,随着人工智能技术和船舶工业的发展,无人船艇(Unmanned Surface Vessel,USV)凭借着吃水浅、能耗低、操纵灵活且无需载人等优势,在
学位
船舶避碰决策是船舶智能航行与无人驾驶技术的重要组成部分,也是难点之一。目前对船舶避碰决策的研究主要以两船和多船避碰的集中式算法为主,且较少考虑多船局面下不同船舶避让的不协调现象。本文针对目前船舶避碰研究中存在的不足,考虑如何能够避免或减少针对不同来船避让行动不一致时产生的船舶避让冲突,提出了避让冲突消解策略;同时引入分布式决策框架,构建一种基于避让冲突消解策略的多船分布式实时避碰决策模型,并通过大