【摘 要】
:
为了实现水下机器人在跟踪复杂轨迹时具有较高的精度和稳定性,提出了利用深度强化学习实现水下机器人最优轨迹控制的方法:首先,建立基于2个深度神经网络(Actor网络和Critic网
【基金项目】
:
广东省科技计划项目(2016B090917002,2016B090926004);华南师范大学青年教师科研培育基金项目(15KJ13);国家级大学生创新创业训练计划项目(201610574150)
论文部分内容阅读
为了实现水下机器人在跟踪复杂轨迹时具有较高的精度和稳定性,提出了利用深度强化学习实现水下机器人最优轨迹控制的方法:首先,建立基于2个深度神经网络(Actor网络和Critic网络)的水下机器人控制模型,其中Actor网络用来选择动作,Critic网络用来评估Actor网络的训练结果;其次,构造合适的奖励信号使得深度强化学习算法适用于水下机器人的动力学模型;最后,提出了基于奖励信号标准差的网络训练成功评判条件,使得水下机器人在确保精度的同时保证稳定性.仿真实验结果表明:在解决一定精度内的水下机器人复杂轨迹跟踪问题时,该算法与传统PID控制算法相比具有更优的性能.
其他文献
第六届全国语言文字应用研讨会于8月23至28日在连云港举行。本次会议由教育部语言文字应用研究所主办,淮海工学院文学院承办。教育部副部长、国家语委主任郝平,国家语委副主任、教育部语信司司长李宇明出席了开幕式并做了重要讲话,教育部语言文字应用研究所所长姚喜双主持了开幕式。
目的观察分析普外手术患者医院感染的发生情况与手术室集束化护理管理的相关性,为制定医院感染预防计划提供依据。方法选取2017年1~12月普外手术治疗的122例患者为对照组,给
对裁判文书中判决结果的倾向性分析是完成律师推荐系统的前提,如何高效的实现判决结果倾向性分析是本文的重点.本文提出了基于注意力机制和BiGRU的判决结果倾向性分析模型.首
目的探讨应用三维超声心动图评价糖尿病患者早期左心室功能改变及其指标与血清学代谢指标的相关性。方法收集90例2型糖尿病患者[早期糖尿病患者48例(早期糖尿病组)、早期糖尿
如何检测出B族维生素是否存在,存在的数量,对于人类如何科学摄取维生素B,提高自身免疫力具有重要的参考价值。
红色文化激励着一代又一代的中华儿女,为理想和信仰去拼搏奋斗。黄冈红色文化深沉厚重,将红色文化融入高职思政课教学十分必要;红色文化资源是天然的思政课教学资源,融入思政
在乡村振兴战略背景下,"互联网+高职教育"有独特的自我需求和市场需求。当前的高职教育出现了一系列问题,诸如传统高职教育弊端还程度不同地存在,人才培养模式缺乏创新性,高
笔者所任教的学校,地处城乡接合部,多数小学生都是进城务工的农民工子女,相当一部分学生数学基础不扎实,造成及格率有所下降,后进生数量也随之扩大。笔者接到一个新班,数学及格率仅有58%,优秀率只有16%。为此,对班级小学数学的现状进行调查,根据小学数学教学模底测试的成绩进行定性和定量分析,找出影响小学数学教学质量的主要原因,针对普遍存在的问题和班级具体情况,制定出开展“提高及格率和优秀率”研究活动计划
本文从迁移理论出发,以调查维吾尔族母语负迁移为目的,结合访谈、调查问卷和写作,对分布在新疆不同高校里的维吾尔族学生进行了调查研究,最后得出结论:维吾尔族学生在英语学习中受
牡丹皮又名牡丹根皮、丹皮或丹根,始载于《本经》,功效为清热凉血活血散淤,近年来对牡丹皮化学成分、药理作用和临床应用的研究都取得了显著成就,现综述如下。 1 降血糖作用