基于深度强化学习的机械臂视觉伺服控制研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:jayzhoujian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的进步与社会的发展,机器人所面临的任务越来越复杂。这就要求机器人能在更复杂的环境中处理更复杂的任务。对于广泛使用的机械臂视觉伺服控制系统,视觉图像的深度学习和机械臂强化学习运动控制已经成为研究的热点。但是传统的基于深度学习的目标检测算法和运动控制强化学习算法,分别针对图像学习和行为学习,彼此相互独立,而在复杂多变且存在大量未知环境的情况下,机械臂视觉伺服控制系统,往往需要视觉学习和行为学习同步进行。基于上述问题,本文将强化学习算法与基于半监督学习的目标检测算法相融合,以实现机械臂视觉伺服学习控制,本文主要研究内容如下:(1)提出了一种基于深度强化学习的机械臂视觉伺服控制方法。该方法在机械臂强化学习过程中同步采样环境目标视觉样本,并自动加入标签,为目标检测学习训练提供数据;同时完善的目标检测模型,为强化学习感知环境提供支撑,在这样的不断交互中实现机械臂的自主学习。其中,通过图像相对位置正运动学约束,对机械臂学习过程的探索范围进行约束,并且通过融合半监督的目标检测算法,实现视觉伺服控制系统中的多阶段学习策略,从而提升机械臂的自主学习能力。(2)设计实现了一种基于ROS的深度强化学习机械臂视觉伺服控制系统。该系统通过搭建了DENSO-ROS模块为机械臂与ROS建立了连接,并且根据ROS仿真模型规则建立了仿真计算模块。利用ROS的松耦合通信机制将伺服系统硬件模块、DENSO-ROS模块、智能算法模块与仿真计算模块有机结合在一起,为机械臂的视觉学习与行为学习提供了平台支撑。(3)在本文设计的系统中对本文所提控制方法进行验证,经过对实验结果进行综合对比,证明了本文所设计系统和所提出控制方法的有效性。
其他文献
随着科技的发展,汽车电子越来越多引入进整车当中。作为汽车电子四大控制系统之一的车身采集控制系统,主要负责对汽车运行状态进行监控和管理,并根据车辆状态作出优化控制决策,实现对车用电器的优化管理,从而提升车辆的人性化、舒适性及安全性。然而,目前车辆中常用的车身控制系统核心控制芯片主要依赖于进口,自主化程度低,在芯片处处受限的当下,常常因缺芯导致车身控制器生产停滞。此外,现有设计方案中各功能模块采用集成
学位
中枢神经系统感染引发的各种疾病一直是神经学领域高死亡率的疾病之一,其目前的主要诊断依靠的是脑脊液细胞学检查,且主要靠人工进行分析,需要消耗大量人工和时间成本,这种分析具有主观性,随意性,因此,亟需一种能对脑脊液细胞进行识别与分类的客观方法和系统;同时,获取脑脊液细胞的过程较复杂,会因为制片过程繁冗造成样本的质量参差,存在粘连重叠的细胞,增加对脑脊液细胞自动识别分析的难度;为了提高不同工艺以及人工经
学位
人体连续运动模态识别是外骨骼与人进行自然人机交互(Human-robot Interaction,HRI)的关键。表面肌电信号(surface Electromyography,s EMG)产生于人体动作,与人体运动直接相关,蕴含丰富的运动信息。因此,对s EMG信号进行解析,可有效识别人体运动模态。然而,在连续运动过程中,s EMG信号容易受到各种噪声干扰,同时s EMG信号本身具有混沌性、非线
学位
机器人在工业、农业、物流、安防、家居等行业被广泛应用,随着任务越来越复杂,单个机器人很难满足人们的需求。由于多机器人系统在高容错性、可拓展性、自主性以及高效性方面的优点,受到广泛关注,在搬运、物流、国防、搜救等场景有更好的应用前景。如何在环境未知且模型未知的情况下,提高多机器人系统自适应能力和交互能力是多机器人系统的一个研究热点。强化学习可以通过机器人和环境的交互,学习到最优的控制策略。因此本文针
学位
在现代医学中,某些眼科手术以及检查对瞳孔尺寸有明确要求。检测瞳孔尺寸的传统方式是使用瞳孔尺进行测量,然而这种方式存在精度不高、前后读数误差较大以及受医生经验影响较大等问题。为了解决这些问题,相关瞳孔计应运而生。目前相关瞳孔计产品大都是国外产品且价格昂贵,国内医院使用率极低,普遍采取传统瞳孔尺方式进行测量。此外国内相关瞳孔尺寸提取的研究也较少。基于此需求,本文设计了一个瞳孔尺寸提取系统,实现对瞳孔实
学位
液压系统是通过液压增强作用力的系统,可用于动力传动和控制系统中,随着工业发展液压系统在各个领域中应用日益广泛,因此加强对液压系统安全运行的保障也日益重要。但由于液压系统趋向专业化和多样化,导致其结构组成越来越复杂,从而增加液压系统部件异常识别的难度。针对液压系统结构组成复杂、难以进行机理建模分析的特点,使用基于数据驱动的方法从系统整体的角度进行研究,研究内容分为特征工程、模型训练、软件实现三个部分
学位
自动泊车系统作为自动驾驶领域的一个分支存在重要的应用价值,环境感知部分是其第一环节,具有关键的作用。室内停车场中复杂场景下的泊车位检测任务常面临污染、光照等环境因素引起的干扰问题,基于鱼眼摄像头和传统视觉的泊车位检测方法具有精度低、鲁棒性差和泛化能力弱等问题,而高精度深度学习网络会带来模型参数较大的压力,为克服现有车位检测技术的不足,本文重点研究了室内停车场中轻量级有效车位检测模型与泊车定位方法,
学位
有效识别高速公路交通异常状态,有利于避免二次事故的发生。其中,数据质量欠佳一直是制约交通异常状态识别率提升的重要因素,对交通流数据进行有效修复可进一步提升异常状态识别的可靠性。同时,此类研究大多基于单一数据源(车检器数据、收费数据和视频数据等)且未考虑数据修复对模型输出的影响,导致模型准确性和鲁棒性较差。伴随着全国电子不停车收费(Electronic Toll Collection,ETC)技术的
学位
加注系统作为发射场地面勤务系统的关键组成部分,在运载火箭发射中扮演着重要角色。繁多的系统设备、复杂的结构机理和恶劣的工作环境,使系统在任务执行过程中运行状态难以获得有效把控。目前,对于加注系统的管理主要依靠操作人员,人力需求大,技术要求高,而且加注系统在各种因素的影响下,个别异常表现得不够清晰,若操作人员没有及时获取到系统的异常信息,就有可能错过采取有效措施的时机,从而引发重大事故。鉴于此,本文以
学位
随着分布式传感器网络在各个行业中的应用变得越来越广泛,传统的有线充电或是电池供电的方式已经不能满足日益发展的传感器的能源供给需求,这严重限制了分布式传感器网络的应用范围。无线电能传输技术,作为一种更加安全、稳定和灵活的新型供电方案,可以从空间全方位给各种耗电装置进行供电,这为分布式传感器网络的能源供给提供了一种全新的方法。在航空火箭内部,有着许多分布放置的传感器,为了保证分布式传感器网络的稳定工作
学位