论文部分内容阅读
无人水面艇(Unmanned Surface Vehicles,USVs)是一种重要的海洋机器人,目前正被广泛研究并逐渐应用于实际。然而USV的自主航行问题仍严重制约其自主性能的提高,尤其是在复杂海况下的危险规避问题亟待解决。本文针对USV在复杂海况下的自主安全航行问题,从四个方面展开研究:全程航迹规划、远程危险规避、近程危险规避、近程危险规避自适应机制研究,具体的研究工作如下:1)在USV全程航迹规划问题研究过程中,以电子海图为基础构建基于栅格的环境模型。对USV全程航迹规划问题进行分析,构建了 USV全程航迹规划的多目标约束优化数学模型。针对USV全程航迹规划的约束条件处理问题,采用距离函数和双惩罚函数对约束条件进行处理。通过引入pareto强度和最小代沟模型,为USV设计出了一种基于多目标遗传算法的全程航迹规划算法。并在实验环境中对全程航迹规划算法的性能进行了验证。2)根据USV在复杂海洋环境中的危险规避特性,在传统的全局危险规避层和近程危险规避层之间增加了远程危险规避模块。针对USV的远程危险规避问题,定义了远程危险规避区域、冲突范围以及规避动态障碍物目标的海上交通规则,并提出了相应的碰撞冲突检测方法。将USV海上交通规则以及碰撞约束对应的可行航向集合作为约束条件,以稀疏A*算法为基础为USV设计出一种动态局部航迹重规划算法。通过设计多种实验场景对算法的性能进行了验证,3)近程危险规避模块是USV实现安全自主航行的直接引导模块,当前针对USV的近程危险规避问题提出了许多算法,但是绝大部分算法都仅仅处于实验室验证阶段,即使进行了海试实验也只是在低速USV(= 5knots)上进行了验证。为此根据高速艇的运动特性和基础运动控制特性,为高速USV提出了一种通用的近程危险规避算法。算法根据周围环境中障碍物的分布和USV艇体基本特性构建航向稳态模型和导航线速度模型,通过航向稳态模型和导航线速度模型输出的导航角度和导航线速度引导USV实现高速安全危险规避。最后在仿真实验和海试实验对算法的相关性能进行了验证。4)当USV在复杂海况下航行时,USV会受到来源于海风、海流等多种外界干扰因素的影响,在USV近程危险规避算法中并没有针对外界干扰问题进行研究。根据海风和海流的干扰特性,以Sarsa在线策略强化学习算法为基础,提出了 USV在复杂海况下的自适应危险规避决策模型,并以渐进贪心策略作为行为探索策略,证明了 USV自适应危险规避决策过程能够以概率1收敛到最优行为策略。论证结果表明,采用在线策略强化学习算法提升USV在复杂海况下的危险规避性能是可行的。并根据理论分析提出了一种基于Sarsa在线策略强化学习的自适应危险规避算法。算法以Sarsa在线策略强化学习算法为基础,采用了一种分治策略的体系结构,运用航向补偿策略对海风和海流引起的干扰进行抵偿,并将USV偏航角的变化趋势引入到自适应学习的奖惩策略中。并通过仿真实验对自适应危险规避算法的有效性进行了验证。