论文部分内容阅读
多机器人追捕问题是多机器人系统研究中的一个典型问题和重要平台。它研究在特定的环境下,设定怎样的规则,使得多个追捕机器人对资源进行合理的分配、协调与竞争,对一个或多个逃跑机器人进行追捕并尽可能取得最佳效益。由于追捕局势是不断变化的,每一个追捕机器人都要依据实际情况做出实时的追捕策略。多机器人追捕是一个涵盖了视觉处理、路径规划、机器学习等多学科领域的问题。本文研究的是多个具有自利性的机器人追捕问题。作为智能体的基本特征之一,当自利性被引入追捕系统时,如何协调多个追捕机器人之间的竞争,将直接影响系统整体的追捕效益,即个体利益与整体利益发生了冲突。通过对多机器人系统的发展历程、多机器人追捕的研究现状和博弈论进行了更加深入的学习,为之后的采用博弈论和量子博弈解决多机器人追捕奠定了坚实的基础。博弈论是解决多方竞争问题的一把有力武器。本文首先规定了多机器人追捕系统的收益规则,并引入博弈论方法,使原本处于盲目竞争中的追捕机器人开始有意识的对自身策略作出调整,从而使个人利益更加贴近整体利益,最终使得追捕结果得到了一定程度的改善。在一些特定情况下,引入博弈论仍然不会使追捕效益得到改善,此时,可以将追捕系统进行量子化,每个追捕机器人的策略也相应的扩展到量子空间中,并对其进行实验,实验表明,每个追捕机器人在追求自身利益最大化的同时,也无意识的兼顾了全局利益,最终解决了在经典博弈下,每个追捕机器人所面临的困境。当所有的追捕机器人的初始位置重合时,上述中的收益规则就不适用了,所以本文在这种情况下引入了新的收益规则,并采用量子最小化博弈来解决竞争问题。同样的,个体利益与整体利益也达到了统一。所以,量子博弈方法是对经典博弈的有力补充。通过这项研究,也拓展了量子博弈的适用领域。