基于深度强化学习算法的空间漂浮基机械臂抓捕控制策略

来源 :载人航天 | 被引量 : 0次 | 上传用户:mathayus0422
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对空间漂浮基座机械臂抓捕非合作目标控制所基于的多体系统动力学模型难以精确建立的问题,基于深度强化学习算法的控制策略,提出一种深度确定性规则策略。通过将机械臂关节控制力矩、抓捕距离以及相对速度等参数定义为高维空间向量,并设置对应的奖励函数,驱动目标参数逼近满足抓捕条件的数值范围,在不依赖运动学模型和动力学模型的情况下,实现对非合作目标的快速逼近和抓捕。仿真算例表明:该控制算法可实现对空间漂浮基机械臂的快速抓捕控制,且能有效降低接触碰撞力的大小,提高抓捕成功率。
其他文献
系统开展太空旅游需求分析和市场预估,构建包含文化、社会、营销、个人和心理5个影响因素以及旅游购买决策、旅游准备、旅游过程中、旅游后4个维度的观光者心理期待和行为能
Objective:To compare the rate of graft uptake and postoperative hearing outcomes of Type I tympanoplasty with perichondrium reinforced cartilage palisade to tem