论文部分内容阅读
不确定规划是目前人工智能研究领域的一个热点问题。基于模型检测的方法在处理许多实际的不确定规划问题上有很大的优势。在完全可观察(或部分可观察)条件下,对可达性目标作规划又是其中一个重要的部分。在现实规划领域中,控制器要执行一个规划解,需要根据当前观察变量的值来确定agent下一步应该执行的动作。在控制器执行规划解的过程中,一些观察信息是没有被用到的,而获取这些观察信息是要花费一定代价的,所以在确保控制器执行规划解无误的前提下,尽可能地减少获取观察信息的代价是一件非常有必要的工作。本文就观察信息约简这一问题进行了深入地研究,将观察信息约简分为两种情况,一种是在已知规划解的条件下进行观察信息约简,另一种是在未知规划解的条件下进行观察信息约简。首先在已知规划解的条件下详细地指出了进行观察信息约简所需要的步骤,先寻找需要区分的状态对集合,再利用状态对集合对观察变量集合进行约简。为强循环规划解的观察信息约简设计了ORSCP和ORSCPM两种可行算法,这两种算法的主要区别在于寻找需要区分状态对集合的方法不同,在同一规划领域中,两种算法的执行效果会有所不同,所以应根据实际情况选择适当的算法。目前,对多agent的研究都集中在确定动作的多agent规划领域,然而对于存在不确定动作的多agent规划领域的研究还是极少的。在不确定多agent规划领域未知规划解的条件下,本文设计了一个求解协同规划解的ORMAP算法,该算法首先通过将整个领域的状态进行分层,找出可能发生冲突的状态,再利用以最小代价优先的回溯法搜索协同规划解,并且在搜索解的过程中进行观察信息约简,使求出的协同规划解是众多符合条件的协同规划解中所需要的观察信息较少的。通过实验和分析可以看出,算法的执行效率是比较高的。