基于Q-learning的机器人避碰控制方法的研究

来源 :哈尔滨工程大学学报 | 被引量 : 0次 | 上传用户:chenlm08
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
首先介绍了基于表格Q-learning 的方法,然后提出了一种用神经网络实现的Q-learning 方法,利用这种方法实现机器人避碰行为学习,并进行了仿真试验.最后讨论了提高强化学习速度的方法. Firstly, the method based on form Q-learning is introduced. Then a Q-learning method based on neural network is proposed. By this method, robot avoidance behavior learning is simulated and simulated. Finally, we discuss ways to improve the speed of intensive learning.
其他文献
提出一种GIS系统中复杂多边形填充的并行处理技术.这种技术利用一种自带CPU 可编程的图形卡,将扫描线相关法分解成两个并行处理算法,解决了实际系统中复杂多边形填充的速度瓶颈问题.该算法已用在某GIS应用系统中,取得了良好的效果.①
期刊
三聚氰胺和甲醛经羟甲基化、醚化反应,生成甲醚化六羟甲基三聚氰胺树脂.探讨了该硬挺剂的制备工艺和条件,通过浓缩脱醛、添加捕醛剂DF-460,获得了性能稳定的超低醛硬挺剂WD-2
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
本科2006年6月至2008年8月采用更昔洛韦(商品名:丽科伟)联合半导体激光局部照射治疗带状疱疹120例,取得较好的疗效,现报告如下.
期刊
期刊
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
一般对星载计算机都要求可靠性高,重量轻,体积小,功耗低.对小型探测卫星来说这种要求更强烈,希望硬件设计尽量少用或不用冗余系统来保证可靠性.本文研究尽量少采用硬件冗余而
介绍了氯碱生产过程和烧碱蒸发的工艺方法,并分析了国内外烧碱生产方面的发展趋势.