基于Q-learning的机器人避碰控制方法的研究

来源 :哈尔滨工程大学学报 | 被引量 : 0次 | 上传用户：chenlm08

【摘要】

：

首先介绍了基于表格Ｑ－ｌｅａｒｎｉｎｇ的方法，然后提出了一种用神经网络实现的Ｑ－ｌｅａｒｎｉｎｇ方法，利用这种方法实现机器人避碰行为学习，并进行了仿真试验．最后讨论了提高强化学习速度的方法． Firstly, the met

【作者】

：

杨广铭张汝波顾国昌

【机构】

：

哈尔滨工程大学计算机与信息科学系!黑龙江哈尔滨150001,哈尔滨工程大学计算机与信息科学系!黑龙江哈尔滨150001,哈尔滨工程大学计算机与信息科学系!黑龙江哈尔滨150001

【出处】

：

哈尔滨工程大学学报

【发表日期】

：

1999年05期

【关键词】

：

Q-learning 机器人神经网络

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

首先介绍了基于表格Ｑ－ｌｅａｒｎｉｎｇ的方法，然后提出了一种用神经网络实现的Ｑ－ｌｅａｒｎｉｎｇ方法，利用这种方法实现机器人避碰行为学习，并进行了仿真试验．最后讨论了提高强化学习速度的方法． Firstly, the method based on form Q-learning is introduced. Then a Q-learning method based on neural network is proposed. By this method, robot avoidance behavior learning is simulated and simulated. Finally, we discuss ways to improve the speed of intensive learning.

其他文献

GIS应用系统中复杂多边形并行处理技术

提出一种ＧＩＳ系统中复杂多边形填充的并行处理技术．这种技术利用一种自带ＣＰＵ可编程的图形卡，将扫描线相关法分解成两个并行处理算法，解决了实际系统中复杂多边形填充的速度瓶颈问题．该算法已用在某ＧＩＳ应用系统中，取得了良好的效果．①

期刊

GIS多边形扫描线相关法并行处理

电气设备中接地装置浅析

期刊

超低甲醛硬挺剂WD-2的合成

三聚氰胺和甲醛经羟甲基化、醚化反应,生成甲醚化六羟甲基三聚氰胺树脂.探讨了该硬挺剂的制备工艺和条件,通过浓缩脱醛、添加捕醛剂DF-460,获得了性能稳定的超低醛硬挺剂WD-2

期刊

三聚氰胺甲醚化硬挺剂捕醛剂

出水洞水库面板堆石坝次堆区优化设计