策略重用相关硕士博士期刊学术论文

人工智能时代下,强化学习是赋予智能体在开放多变的物理环境中具有自主决策能力的重要手段。然而,由于强化学习在训练过程中需要智......

学位

强化学习策略重用策略评估

在多Agent系统中,由于环境是动态变化的,其他Agent行为是未知的,要建立领域完备的先验模型几乎不可能,而且许多领域知识也是在Agen......

学位

在RoboCup Keepaway中,球员使用强化学习能获得很好的高层策略。然而由于Keepaway任务的状态空间巨大,强化学习需要探索很多步才能......

期刊

鉴于空战机动在智能化协同对抗中的重要地位,分析了现有典型算法的不足。从智能体建模方法入手,将认知行为模型嵌入强化学习智能体......

会议