基于增强学习的水下无人航行器控制方法研究

来源 :浙江理工大学 | 被引量 : 0次 | 上传用户:qy313
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自主水下航行器(Autonomous Underwater Vehicle,AUV)已成为水下无人自动化作业过程中的一种重要工具,在实际应用中,展现了越来越强的重要性。AUV发展的这几十年来,伴随着工业控制领域各种控制算法的推陈出新,AUV的控制算法也在不断的优化更新。从最初经典的比例-积分-微分(Proportion-Integral-Differential,PID)控制算法衍变到模糊控制、自适应控制,再到智能控制以及各种组合控制算法,使得AUV的控制趋于成熟,但是面对更加复杂的任务和工作环境,上述算法还存在一些诸如:自适应能力不强、鲁棒性不好、控制精度较差等问题。本文针对传统的AUV控制算法所存在的缺点进行改进,提出了基于增强学习的AUV控制算法。本文研究了AUV运动学和动力学模型,设计了基于增强学习的AUV控制改进算法,搭建了小型AUV控制系统并验证了算法实际性能,具体研究内容阐述如下:1.针对复杂的浅水域环境,建立了水下航行器的六自由度运动学和动力学方程,并针对本文所设计的小型自主水下航行器进行了模型的简化,根据所提出的模型,进行了仿真验证。2.研究了常用的增强学习算法,分析了这些算法的特点和应用范围。然后研究了水下航行器的控制模型,结合增强学习的特点,设计了基于增强学习的水下航行器控制算法。在算法中采用了基于策略梯度的DPG(Deterministic Policy Gradient)结合神经网络的方法提高算法泛化能力,并借鉴了DQN(Double Q-Network)的思想,采用了相同结构的双网络模型,来解决算法训练中的不稳定性。针对水下航行器续航时间短的问题,在控制算法的经验回放样本池中引入优先级概念,使用二叉树的方式来实现样本的优先级采样,使得算法的收敛速度迅速提高,增加了水下航行器的续航能力。3.针对江河湖泊等浅水域环境,本文设计了一款小型的自主水下航行器,独特的外观设计使其既具有鱼雷状AUV的低阻力优点,又具有开架式AUV灵活的运动控制。为了在陆地上可以实时、直观地了解水下航行器的运动状况,本文还配套设计了一个地面站系统,其具有数据双向通信、运动控制、任务下发等多种功能。最后,通过进行大量的仿真实验,对本文所提出的控制算法进行有效性验证。同时基于搭建的控制系统,在实际环境中使用所提出的控制算法对AUV进行控制,相关实验结果也表明了该控制算法具有良好的控制效果。
其他文献
省级科研课题“师范院校语文教育专业亟需开设朗读教学课”,是在语文基础教育改革的背景下,为适应新课程改革需要,提高中小学语文教师朗读教学能力,优化师范院校语文教育专业课程
离婚纠纷案件在司法实践中,通常被认为案件难度低,适用于新入职审判员练手的初级案由。然而离婚案件在每年法院受理的民事案件中占比较大,妥善处理每起到法院提起诉讼的离婚
[背景]白细胞介素-33(Interlukin-33,IL-33)属于IL-1家族成员,在固有免疫和获得性免疫中都发挥着重要作用。在病毒感染中,IL-33被发现具有促进细胞毒性T淋巴细胞(CTL)应答、
为研究林冠对降雨的再分配规律,并尝试新的林冠截留研究试验方法,验证Gash模型在本地区的适用性,本研究以北京西山鹫峰林场优势树种刺槐、侧柏和油松林为研究对象,分析了三种林分林冠截留、穿透雨、树干茎流等特征,揭示了该区主要优势树种的降雨再分配特征;基于三种树种并通过控制叶面积指数进行了用于人工降雨试验的模拟林冠的开发研究,进行了不同降雨量以及相同降雨量不同降雨强度和叶面积指数的人工降雨试验,将模拟试
大型直缝焊管在成形过程中受到焊接热应力、成形设备、模具整体精度等因素的影响,导致成品管件整体直线度不能满足行业标准要求,所以需要对其进行矫直。针对大型直缝焊管的几
目的:甲状腺未分化癌(ATC)是人类甲状腺癌相关死亡的主要原因,而且目前的医治方法大多收效甚微。因此,迫切需要识别在甲状腺未分化癌的肿瘤发生中的新型分子靶点以便为甲状腺
本文是一篇翻译项目报告。翻译项目原文取自兰德公司于2016年12月14日公布的关于伊拉克—库尔德斯坦问题的研究报告。该报告原文标题为:Regional Implications of an Indepen