基于强化学习的数据驱动最优镇定控制及仿真

来源 :模式识别与人工智能 | 被引量 : 0次 | 上传用户:huangwily
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
利用Q-学习算法,针对模型未知只有数据可用的非线性被控对象,解决最优镇定控制问题。由于状态空间和控制空间的连续性,Q-学习只能以近似的方式实现。因此,文中提出的近似Q-学习算法只能获得一个次优控制器。尽管求得的控制器只是次优,但是仿真研究表明,对于强非线性被控对象,相比线性二次型调节器和深度确定性梯度下降方法,文中方法的闭环吸引域更宽广,实际指标函数也更小。
其他文献
在运输一线实施党支部建设“三年基础工程”,这既是新形势下加强铁路基层党组织建设、创新基层党组织工作方法的迫切需要,也是落实全面从严治党要求,增强党支部凝聚力、创造力和