论文部分内容阅读
随着经济的发展、社会的进步,人们在享受现代文明的同时,却也面临着日益严重的交通问题。众所周知,该问题的解决一定程度上得益于良好的交通控制策略。本文结合神经动态最优化和自适应动态规划两种技术,研究了交通控制系统中的若干基本问题,给出了更为有效的交通控制算法。主要研究内容及结果如下:
⑴研究了城市交叉路口过饱和交通状态下的最优信号配时问题。对于二相位和四相位情况,基于神经动态最优化方法,分别给出最优信号配时器。二相位情况的试验结果表明,此时的最优控制律为Bang-Bang-Like形式,而非文献中给出的Bang-Bang形式。采用神经动态最优化方法,四相位情况只是二相位情况的简单扩展,相应的试验结果表明最优控制律仍近似为Bang-Bang-Like形式。
⑵研究了高速公路系统中可变速度限制最优协调控制问题。建模方面,基于驾驶员顺从度与限速强度成反比的观点,给出更为合理的可变限速模型;控制方面,采用神经动态最优化方法给出最优限速协调控制器,并通过实验仿真验证了控制器的有效性。
⑶基于增强式学习中的适合度轨迹机制,提出了ADHDP(λ)算法,分析了该算法与基于遗忘因子学习方法的区别,并通过Cart-Pole系统验证了其有效性。该算法将极大地推动ADHDP方法用于在线学习控制问题。另外,可以很自然地将适合度轨迹机制扩展到其它自适应动态规划方法,比如DHP和GDHP等。
⑷对于Narendra基准控制问题,给出了两种新的基于DHP的设计方法。本文的方法采用当前时刻的信息定义系统效用函数,极大地降低了DHP设计的复杂度。另外,本文提出了更为普适的Critic启发式设计准则,该准则对于某些大延时系统的自适应动态规划求解具有重要意义。
⑸研究了高速公路系统中单个入口匝道以及多个入口匝道基于自适应动态规划的控制方法。对于单个入口匝道控制,设计了ADHDP控制器,并通过离线训练、在线适应的方式验证了该控制器的有效性。对于多匝道协调控制,根据是否考虑入口匝道排队,给出了两种DHP设计方案。这里,DHP的设计应用了本文提出的新的Critic设计准则。试验仿真结果表明DHP控制器具有良好的协调控制能力以及鲁棒性能。
⑹探讨了上述交通控制算法在交通控制系统中的嵌入方式,提出以网络为背景、采用“当地简单/远程复杂”思想、通过移动Agent机制予以实现的框架。