稀疏奖励相关论文
调头任务是自动驾驶研究的内容之一,大多数在城市规范道路下的方案无法在非规范道路上实施。针对这一问题,建立了一种车辆掉头动力学......
在搜救领域中,透过程序完成半自主或自主飞行控制,无人机能够协助救难人员更好地完成救援任务。搜救任务中涉及到多个目标间的搜索,相......
飞行器空战智能决策是当今世界各军事强国的研究热点。为解决近距空战博弈中无人机的机动决策问题,提出一种基于深度强化学习方法的......
从上世纪末起,智能无人武器在全球范围内几次重大的局部性战争中可谓出尽了风头,而随着本世纪初人工智能技术的又一次爆发增长,人......
针对传统深度强化学习中移动机器人在稀疏奖励环境下只有在规定时间步内到达目标位置才能得到积极奖励,中间过程的每一步都是负面......
奖励函数的设置对强化学习任务的策略求解有很大的影响。对于新环境探索等任务,奖励函数通常是稀疏的,即只在少数状态下返回高价值......
随着航空航天事业的高速发展,越来越多的飞行器采用群体或多体协同的方式执行任务,呈现出典型的多智能体特征,适于使用多智能体理......
深度强化学习作为一种模仿人类学习过程的人工智能方法,为许多复杂问题提供了解决方法,受到了广泛的研究与关注。把深度强化学习应......
在强化学习中,当处于奖励分布稀疏的环境时,由于无法获得有效经验,智能体收敛速度和效率都会大幅下降.针对此类稀疏奖励,文中提出......

