论文部分内容阅读
本文以矩阵半张量积为工具,以逻辑动态系统的代数状态空间表示为方法,研究人工智能中智能推理与智能决策的几个理论与具体决策问题的解法.首先研究逻辑动态系统的两个基础理论问题,然后将逻辑动态系统的建模与控制应用到智能规划和博弈这两类决策问题中.依照著名的人工智能先驱——HerbertAlexanderSimon教授提出的理性决策步骤,本文依次对决策过程的信息获取、策略设计、策略选择以及策略实施四个阶段中几个代表性的问题使用矩阵半张量积方法进行研究,得到了若干结果,为智能推理与智能决策提供了基于控制方法的理论依据.由于逻辑动态系统的理论研究和它在决策问题中的应用仅仅处于发展的前期阶段,基于矩阵半张量积方法的控制与决策仍具有无限的潜力和广阔的探索空间,因此值得进一步的探讨与挖掘.本文的主要研究内容如下:
研究布尔控制网络的输出跟踪(输出调节)问题.首先提出控制吸引子(控制不动点与控制极限环)的概念,同时给出计算给定状态集含有的控制吸引子的公式.其次证明给定状态集的最大控制不变子集是该状态集里可以通过有限步控制,在每一次更新后依然属于该状态集的条件下,能最终控制到控制吸引子的状态所组成的集合.之后构建一个辅助系统,该系统结合了原有的布尔控制网络和参考系统.使用最大控制不变子集,基于辅助系统的集合能控性方法,得到一个易于验证的输出跟踪问题可解的充分必要条件.对于可解的输出跟踪问题,分别给出开环控制序列与闭环控制反馈增益矩阵的设计方法,令原网络在最短时间内完成对参考系统的输出跟踪.
研究布尔控制网络的能观性与可重构性判据.通过构造一个辅助系统,把原布尔控制网络“状态对”的控制转化为辅助系统状态的控制.利用集合能控性方法与控制吸引子的概念,将原系统能观性和可重构性的验证问题等价转化为辅助系统的集合能控性问题,并借助辅助系统集合能控的条件分别给出布尔控制网络能观与可重构的判定条件以及矩阵维数不变的判定公式.
研究受限逻辑动态系统的能控性问题,给出系统能控的充分必要条件.经过分析其控制-状态禁止对,将农夫-狼-羊-白菜的渡河问题和传教士与食人族的渡河问题在逻辑动态系统的框架下建模,并转化为包含控制-状态禁止集的受限逻辑动态系统的能控性问题,然后通过系统的能控性条件得到最优解(最短步长解).
研究网络化配对问题的稳定性以及镇定问题.首先给出网络化配对问题的定义和建模,在网络化配对问题的框架下证明稳定安排的存在性并且得到安排的相关性质.其次给出一个算法以验证一个安排是否稳定,并利用逻辑动态系统的代数状态空间方法得到网络化配对问题的稳定性判据.然后采用控制来刻画现实生活中“介绍人”的作用,以达到网络化配对问题的全局集合稳定,并由此分析得到对应系统镇定的相关结果.
研究局势受限博弈,即包含非法局势的普通有限博弈.使用矩阵半张量积方法,将局势受限博弈在逻辑动态系统的框架下建模,进一步研究局势受限博弈的结构和在给定策略更新规则下的动态演化,给出判定一个局势受限博弈是否为势博弈的充分必要条件.此外,给出寻找合法局势集的方法,从而保证在找到的合法局势集下,局势受限博弈是势博弈.为使得到的结论更具应用价值,受近似势博弈概念的启发研究局势受限近似势博弈,给出局势受限博弈空间的正交分解公式,并对于包含多个可选合法局势集的局势受限博弈给出选择合法局势集的算法.
研究局势驱动虚拟对策.局势驱动虚拟对策是一类新的博弈学习算法,是经典虚拟对策的一个改进.首先给出局势驱动虚拟对策的定义.其次使用矩阵半张量积方法给出局势驱动虚拟对策的模型和更新规则,并得到最优响应下的局势驱动虚拟对策关于纳什均衡的吸收性等性质.最后给出若干仿真示例以展示局势驱动虚拟对策的优越性.
研究布尔控制网络的输出跟踪(输出调节)问题.首先提出控制吸引子(控制不动点与控制极限环)的概念,同时给出计算给定状态集含有的控制吸引子的公式.其次证明给定状态集的最大控制不变子集是该状态集里可以通过有限步控制,在每一次更新后依然属于该状态集的条件下,能最终控制到控制吸引子的状态所组成的集合.之后构建一个辅助系统,该系统结合了原有的布尔控制网络和参考系统.使用最大控制不变子集,基于辅助系统的集合能控性方法,得到一个易于验证的输出跟踪问题可解的充分必要条件.对于可解的输出跟踪问题,分别给出开环控制序列与闭环控制反馈增益矩阵的设计方法,令原网络在最短时间内完成对参考系统的输出跟踪.
研究布尔控制网络的能观性与可重构性判据.通过构造一个辅助系统,把原布尔控制网络“状态对”的控制转化为辅助系统状态的控制.利用集合能控性方法与控制吸引子的概念,将原系统能观性和可重构性的验证问题等价转化为辅助系统的集合能控性问题,并借助辅助系统集合能控的条件分别给出布尔控制网络能观与可重构的判定条件以及矩阵维数不变的判定公式.
研究受限逻辑动态系统的能控性问题,给出系统能控的充分必要条件.经过分析其控制-状态禁止对,将农夫-狼-羊-白菜的渡河问题和传教士与食人族的渡河问题在逻辑动态系统的框架下建模,并转化为包含控制-状态禁止集的受限逻辑动态系统的能控性问题,然后通过系统的能控性条件得到最优解(最短步长解).
研究网络化配对问题的稳定性以及镇定问题.首先给出网络化配对问题的定义和建模,在网络化配对问题的框架下证明稳定安排的存在性并且得到安排的相关性质.其次给出一个算法以验证一个安排是否稳定,并利用逻辑动态系统的代数状态空间方法得到网络化配对问题的稳定性判据.然后采用控制来刻画现实生活中“介绍人”的作用,以达到网络化配对问题的全局集合稳定,并由此分析得到对应系统镇定的相关结果.
研究局势受限博弈,即包含非法局势的普通有限博弈.使用矩阵半张量积方法,将局势受限博弈在逻辑动态系统的框架下建模,进一步研究局势受限博弈的结构和在给定策略更新规则下的动态演化,给出判定一个局势受限博弈是否为势博弈的充分必要条件.此外,给出寻找合法局势集的方法,从而保证在找到的合法局势集下,局势受限博弈是势博弈.为使得到的结论更具应用价值,受近似势博弈概念的启发研究局势受限近似势博弈,给出局势受限博弈空间的正交分解公式,并对于包含多个可选合法局势集的局势受限博弈给出选择合法局势集的算法.
研究局势驱动虚拟对策.局势驱动虚拟对策是一类新的博弈学习算法,是经典虚拟对策的一个改进.首先给出局势驱动虚拟对策的定义.其次使用矩阵半张量积方法给出局势驱动虚拟对策的模型和更新规则,并得到最优响应下的局势驱动虚拟对策关于纳什均衡的吸收性等性质.最后给出若干仿真示例以展示局势驱动虚拟对策的优越性.