Dyna-Q相关论文
针对基于强化学习的干扰决策方法存在着收敛速度过慢的问题,在Dyna-Q算法的基础上提出一种规划步数自适应的Dyna-Q干扰决策算法。在......
随着人工智能的兴起和机器学习的快速发展,越来越多的科学研究人员关注于路径规划模型及其相关应用。环境的多样性和差异性都给路......
This paper presents an extended Dyna-Q algorithm to improve efficiency of the standard Dyna-Q algorithm.In the first epi......

