基于多层强化学习的多机器人团队协作

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:allans
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出的多层强化学习思路,应用在仿真平台实验及真实机器人实验中,较好的实现了多机器人的团队协作,表明了该算法的有较强的适用性和通用性,为以后将该方法应用到实际机器人奠定了一定基础。 首先对多移动机器人智能学习的研究现状进行简单的论述,并对多移动机器人团队协作系统的特点、体系结构进行简要的概述。接下来,在简介强化学习现状和背景之后,介绍了强化学习方法基本概念、算法原理及其基本结构,详细论述了多种强化学习算法以及多机器人团队协作的几种常见任务。然后,对基于多层RL的强化学习进行了仿真实现。在简介仿真软件之后,阐述了采用单层RL所面临的问题从而提出了采用多层的原因和思路。随之进行了详细的多层RL仿真实验设计和仿真结果分析。最后,在介绍真实RL实验平台之后,设计了真实机器人的强化学习实验任务。对任务进行了具体的实验设计,并针对真实实验结果进行了处理和分析。
其他文献
【基金项目】本文是中国教育学会“十二五”科研规划项目“区域教育现代化建设背景下教师专业发展研究”(编号:19070251)、广州市花都区“教师专业发展研究”专项课题“初中教师心理素养的现状研究”(编号:HDJS201204)成果之一。  【中图分类号】G635.1 【文献标识码】A 【文章编号】2095-3089(2015)05-0191-01  人的素养主要包括身体素养、心理素养和社会文化素养,
近年来,脑电研究在国际学术界受到越来越多的重视,并展示出了重要的应用前景。脑电研究领域的两个关键问题是脑电正问题和脑电逆问题。脑电正问题是已知脑内的电流分布情况,
【中图分类号】G635.5 【文献标识码】A 【文章编号】2095-3089(2015)05-0193-02  在全球经济一体化的背景下,教育国际化的趋势也越发明显。近些年,我国每年出国留学的人数逐年增加。据报道,2014年度我国出国留学人员总数达到了45.98万人,与2013年度的统计数据相比较,出国留学人数增加4.59万人,增长了11.09%。  在教育改革不断深化的背景下,我校自2013年起
半导体制造系统是公认的最复杂的生产系统之一。半导体晶圆生产调度与控制问题是比一般Flow Shop和Job Shop更复杂的第三类生产线控制问题。但由于半导体制造是高投资、高收