基于深度强化学习的水下机械臂抓取研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:WXY0216
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人类对海洋探索的不断深入,科学考察与水下作业等活动也日渐增多,对支撑这些活动的水下作业设备、水下作业技术也提出了更高的要求,水下液压机械臂作为水下作业的主流工具之一,通常会搭载在水下机器人上共同完成水下作业。目前水下机械臂的控制方式以主从伺服控制为主,虽然主从伺服控制方式较为成熟且被广泛应用,但其作业效果很大程度上取决于工作人员对于水下环境的感知以及临场操作,整个过程耗费时间长,作业精度低,已经越来越不能满足高效复杂的任务需求。如何将自主作业技术应用于水下复杂作业任务是目前亟待突破的关键技术问题之一。实现水下机械臂自主作业面临着诸多问题,例如水下机械臂的建模与运动控制、水下目标物识别与定位、水下机械臂轨迹规划等。本文将研究重点放在水下液压机械臂的运动控制之上,将深度强化学习与水下液压机械臂的运动控制相结合,实现对典型目标物的自主抓取,具体内容如下:首先,为水下液压机械臂建立运动学模型,并对其工作空间进行分析求解,针对机械臂末端定位精度较差的问题,对其进行了关节标定与运动学标定,保证了机械臂末端定位精度满足抓取要求。其次,为水下液压机械臂搭建了基于ROS的运动控制系统,包括上位机中利用单目视觉与ArUco二维码实现对目标物的定位以及建立水下机械臂、深度强化学习智能体、仿真环境之间的通讯等。选择对连续动作训练更为有效的PPO算法进行落地,为水下机械臂搭建基于OpenAI-Gym与MuJoCo的仿真训练场景“SIA7FARMPickANDPlace-v1”,针对典型目标物抓取任务采用了一种新型奖励函数,训练结果表明新型奖励函数的收敛速度、每回合的平均奖励均优于传统奖励函数,仿真环境中的抓取成功率可以达到90%左右。最后设计并进行了陆地以及水下实验,对实验过程中机械臂末端路径以及关节角度进行了误差分析,并与基于传统视觉伺服的水下目标物抓取方法进行对比,验证了基于深度强化学习的水下目标物抓取方法的可行性和有效性。
其他文献
近年高校校生纠纷层出不穷,由于解决途径不畅,导致学生与学校对簿公堂的事件日益增多,继“医闹”以后,“校闹”开始得到社会和大众的关注。“校闹”产生的原因是多方面的,其中重要的一个方面就是内部纠纷解决机制的缺失。鉴于高校校生纠纷的特殊性,传统的行政复议、诉讼等外部解决方式有其劣势,并非最好的选择,为此最新《普通高等学校学生管理规定》(以下简称《规定》)要求,各高校应当设立纠纷解决机构,设计相应程序,然
晋绥军作为一支军阀武装,在民国存在达38年之久,其兴衰荣辱历程主要是以下几方面要素之互动关系:地盘、经济能力、统率之才能、将领的忠诚、兵源的稳定、士兵的训练、武器装
本文在研究精密和超精密加工技术的发展对直线度误差分离技术所提出的新要求的基础上,定量分析了传感器初始对准误差、忽略摆角误差和传感器漂移特性差异在时域和频域直线度误
为了研究灭蝇胺在银耳及银耳培养料中的降解残留规律,建立了同时测定银耳、银耳培养料中灭蝇胺和三聚氰胺残留量的高效液相色谱法,测得灭蝇胺在银耳和银耳培养料中的平均回收
<正>菟丝,一年生草本植物,无叶,黄色的茎非常纤细,直径仅约1毫米。而且,它从不单独生长,总是缠绕在其他植物上。研究发现,菟丝不能进行光合作用,是一种寄生植物,它的生命只能
期刊
应用齿轮范成加工原理和UG三维建模技术,构建了渐开线直齿圆柱齿轮精确齿形的三维几何模型,并将其导入ANSYS软件。以GB3480—83标准中的齿根应力计算方法的计算结果为基准,在载
中共“十九大”以来,为应对日趋严重的生态环境问题,中国政府相继提出建设“园林城市”、“生态城市”、“森林城市”、“低碳城市”等目标,旨在使城市的生态环境建设朝着更
随着资本市场的不断发展,会计信息对扩大市场规模、增强投资者信心的作用越来越重要。会计信息被广泛应用的同时,会计信息失真、财务舞弊等现象频频出现,严重影响了整个资本
以培养学生综合能力的教育理念为指导,构建“四段式”教学模式,在体育教育专业推铅球教学中进行实验研究。结果发现:采用“四段式”教学模式教学,有利于学生掌握基本理论知识