状态集结相关硕士博士期刊学术论文 - 搜论网

状态集结相关论文

基于状态软集结的相对值迭代算法

在大规模随机控制问题中,值函数逼近是一种克服维数灾的方法.考虑平均模型马氏决策规划(MDP)的状态软集结相对值迭代算法,在Span压......

期刊

动态规划马氏决策规划紧凑表示状态集结平均报酬 dynamic programming Markov decision processes compact

一种状态集结因子化SARSA（λ）强化学习算法

提出了一种自适应状态集结因子化SARSA(λ)强化学习算法,在学习的过程中利用Bellman余留数进行状态集结,通过集结,大大减少了状态......

期刊

强化学习状态集结 MDPs Q(λ)学习 SARSA(λ)学习机器学习因子化 Bellman余留数 reinforcement learningstate

看过本文同时还关注