论文部分内容阅读
通过分析模具制造项目工期、费用与报酬的不确定性以及模具返修、随机插单等突发事件频繁发生的特点,构建了基于离散时间马尔可夫链的模具制造项目群随机演化模型,提出了求解该随机动态规划模型的算法。通过并行启发式策略进行仿真和多步Q学习,有效解决了“维数灾难”问题,结合示例阐述了算法执行过程,说明了其可行性与可靠性。与标准Q学习方法相比,多步Q学习方法能够有效提高算法收敛速度。