基于多层强化学习的多机器人团队协作

来源 :上海交通大学 | 被引量 : 0次 | 上传用户：allans

【摘要】

：

本文提出的多层强化学习思路，应用在仿真平台实验及真实机器人实验中，较好的实现了多机器人的团队协作，表明了该算法的有较强的适用性和通用性，为以后将该方法应用到实际机器人奠

【作者】

：

叶道年

【机构】

：

上海交通大学

【出处】

：

上海交通大学

【发表日期】

：

2006年期

【关键词】

：

多机器人系统团队协作行为多层强化学习动作映射

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文提出的多层强化学习思路，应用在仿真平台实验及真实机器人实验中，较好的实现了多机器人的团队协作，表明了该算法的有较强的适用性和通用性，为以后将该方法应用到实际机器人奠定了一定基础。首先对多移动机器人智能学习的研究现状进行简单的论述，并对多移动机器人团队协作系统的特点、体系结构进行简要的概述。接下来，在简介强化学习现状和背景之后，介绍了强化学习方法基本概念、算法原理及其基本结构，详细论述了多种强化学习算法以及多机器人团队协作的几种常见任务。然后，对基于多层RL的强化学习进行了仿真实现。在简介仿真软件之后，阐述了采用单层RL所面临的问题从而提出了采用多层的原因和思路。随之进行了详细的多层RL仿真实验设计和仿真结果分析。最后，在介绍真实RL实验平台之后，设计了真实机器人的强化学习实验任务。对任务进行了具体的实验设计，并针对真实实验结果进行了处理和分析。

其他文献

多余的“严肃”

读报刊、听广播,经常可以看到.听到这样的话:对某人、某事“要依法严肃处理.”仔细推敲,“严肃”二字实属多余. 我们的每一部法律都是严肃的,依法处理任何一件事、一个人也

期刊

二字这么一来

窄行距棉花收益大

美国棉花科学家经过多次试验后得出结论,将棉花行距由101.6厘米改为35.6厘米后,单产显著提高。据科研人员在加利福尼亚州英佩里尔盆地试验,行距为101.6厘米的棉田,籽棉平均

期刊

行距籽棉加利福尼亚州科研人员棉花生长期美国棉花里尔单产农业研究月份

初中教师心理素养的构成和量化

【基金项目】本文是中国教育学会“十二五”科研规划项目“区域教育现代化建设背景下教师专业发展研究”（编号：19070251）、广州市花都区“教师专业发展研究”专项课题“初中教师心理素养的现状研究”（编号：HDJS201204）成果之一。　　【中图分类号】G635.1 【文献标识码】A 【文章编号】2095-3089（2015）05-0191-01　　人的素养主要包括身体素养、心理素养和社会文化素养，

期刊

初中教师心理素养构成文化素养素质教育身心素养身体素养决策者状况学校学生校园

脑电计算中有限元真实头模型的构造研究

近年来,脑电研究在国际学术界受到越来越多的重视,并展示出了重要的应用前景。脑电研究领域的两个关键问题是脑电正问题和脑电逆问题。脑电正问题是已知脑内的电流分布情况,

学位

脑电有限元法头模型

沪深股市首发新股盈利预测的实证研究

上市公司盈利预测信息是确定股票上市后股价走势的重要依据,它对投资者的投资行为具有引导作用。国外的盈利预测实证研究兴起于上世纪70年代末期,而国内这方面的研究还刚刚起

期刊

盈利预测信息披露会计信息股票上市资本市场投资行为股价利润总额应收账款周转率存货周转率

车辆调度问题启发式算法研究

车辆优化调度问题是现代物流系统优化中关键的一环，也是开展电子商务活动中不可缺少的内容。对车辆优化调度理论与方法进行系统研究是构建综合物流系统、建立现代调度指挥系统

学位

车辆优化调度禁忌搜索算法启发式算法PDPTW问题物流优化插入算法局域搜索

广播电视系统科技情报工作会议在津举行

广播电视系统科技情报工作会议暨第三届情报网大会于1988年11月26日至29日在天津召开。参加会议的有41个单位53位代表。

期刊

科技情报工作广播电视系统章之俭广播电影电视部广播科学研究所技术手册情报人员专题报告日至有偿服务

智能楼宇监控系统的设计

随着计算机技术、通信技术以及控制技术的迅速发展，人们对信息社会和安全舒适的生活方式的需求不断增加，目前兴起的智能建筑的热潮，正是适应了这种社会信息化、生活舒适化与经济

学位

智能楼宇现场总线监控系统模糊控制智能楼宇监控系统社区智能化管理

开设微型课程模块对提升高中生国际竞争力的作用

【中图分类号】G635.5 【文献标识码】A 【文章编号】2095-3089（2015）05-0193-02　　在全球经济一体化的背景下，教育国际化的趋势也越发明显。近些年，我国每年出国留学的人数逐年增加。据报道，2014年度我国出国留学人员总数达到了45.98万人，与2013年度的统计数据相比较，出国留学人数增加4.59万人，增长了11.09%。　　在教育改革不断深化的背景下，我校自2013年起

期刊

微型课程模块提升高中生国际竞争出国留学人员全球经济一体化教育国际化统计数据增长发明

基于离散事件仿真的半导体生产系统建模与调度算法研究

半导体制造系统是公认的最复杂的生产系统之一。半导体晶圆生产调度与控制问题是比一般Flow Shop和Job Shop更复杂的第三类生产线控制问题。但由于半导体制造是高投资、高收

学位

生产调度生产线控制半导体生产离散事件仿真半导体制造系统

基于多层强化学习的多机器人团队协作

其他学术论文