ε-greedy策略相关硕士博士期刊学术论文

针对深度强化学习算法在路径规划的过程中出现与所处环境交互信息不精确、回馈稀疏、收敛不稳定等问题，在竞争网络结构的基础上，提出......

期刊

通过虚拟化技术,云计算实现了计算、存储等资源的灵活分配。资源规模大、多任务并发执行、应用资源请求动态变化等使得云计算中心......

学位

为解决传统的深度Q网络模型下机器人探索复杂未知环境时收敛速度慢的问题,提出了基于竞争网络结构的改进深度双Q网络方法(Improved......

期刊

强化学习作为机器学习中的一种无监督式学习,在实际应用中的难点之一便是如何平衡强化学习中探索和利用之间的关系。在Q学习结合ε......

期刊

强化学习 ε-greedy策略探索与利用