基于神经网络最优化的交通控制技术

来源 :中国科学院自动化研究所 | 被引量 : 0次 | 上传用户:jly1211
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着经济的发展、社会的进步,人们在享受现代文明的同时,却也面临着日益严重的交通问题。众所周知,该问题的解决一定程度上得益于良好的交通控制策略。本文结合神经动态最优化和自适应动态规划两种技术,研究了交通控制系统中的若干基本问题,给出了更为有效的交通控制算法。主要研究内容及结果如下:   ⑴研究了城市交叉路口过饱和交通状态下的最优信号配时问题。对于二相位和四相位情况,基于神经动态最优化方法,分别给出最优信号配时器。二相位情况的试验结果表明,此时的最优控制律为Bang-Bang-Like形式,而非文献中给出的Bang-Bang形式。采用神经动态最优化方法,四相位情况只是二相位情况的简单扩展,相应的试验结果表明最优控制律仍近似为Bang-Bang-Like形式。   ⑵研究了高速公路系统中可变速度限制最优协调控制问题。建模方面,基于驾驶员顺从度与限速强度成反比的观点,给出更为合理的可变限速模型;控制方面,采用神经动态最优化方法给出最优限速协调控制器,并通过实验仿真验证了控制器的有效性。   ⑶基于增强式学习中的适合度轨迹机制,提出了ADHDP(λ)算法,分析了该算法与基于遗忘因子学习方法的区别,并通过Cart-Pole系统验证了其有效性。该算法将极大地推动ADHDP方法用于在线学习控制问题。另外,可以很自然地将适合度轨迹机制扩展到其它自适应动态规划方法,比如DHP和GDHP等。   ⑷对于Narendra基准控制问题,给出了两种新的基于DHP的设计方法。本文的方法采用当前时刻的信息定义系统效用函数,极大地降低了DHP设计的复杂度。另外,本文提出了更为普适的Critic启发式设计准则,该准则对于某些大延时系统的自适应动态规划求解具有重要意义。   ⑸研究了高速公路系统中单个入口匝道以及多个入口匝道基于自适应动态规划的控制方法。对于单个入口匝道控制,设计了ADHDP控制器,并通过离线训练、在线适应的方式验证了该控制器的有效性。对于多匝道协调控制,根据是否考虑入口匝道排队,给出了两种DHP设计方案。这里,DHP的设计应用了本文提出的新的Critic设计准则。试验仿真结果表明DHP控制器具有良好的协调控制能力以及鲁棒性能。   ⑹探讨了上述交通控制算法在交通控制系统中的嵌入方式,提出以网络为背景、采用“当地简单/远程复杂”思想、通过移动Agent机制予以实现的框架。
其他文献
学位
随着我国航天工业的发展,国内对先进飞行器的研制越来越迫切,对风洞试验技术的要求也越来越高。风洞中进行变马赫数、连续变攻角试验时,如何维持风洞内的温度稳定是风洞试验技术
模型预测控制(Model Predictive Control,简称MPC)由于其模型预测、滚动优化、反馈校正的鲜明特点,使其成为处理复杂过程多变量控制的有效算法,在石油、化工等过程领域中获得
随着Internet的飞速发展,用户数量迅速增加,新的网络应用不断涌现,使得网络流量急剧增加,由此引发的网络拥塞已经成为制约网络发展和应用的瓶颈问题。拥塞易造成传输延迟和吞吐量
炼钢—连铸生产计划与物流调度是当前国际学术界热点研究课题,也是钢铁企业管理与运行中急需解决的重大关键难题。对炼钢—连铸生产计划以及炼钢车间物流调度有效合理地确定,对
本文综述了内模PID(Internal Model Control-PID,IMC-PID)控制的研究现状,并将IMC-PID控制分别与模糊逻辑和神经网络相结合,提出了几种新的IMC-PID控制算法。首先,针对过程控
由于工业摄像机的光学镜头存在变形,所获取的图像经常存在畸变、偏转和倾斜。在以图像处理为基础的钢水液位测量背景下,本文针对钢水液位测量管图像中的畸变,对摄像机图像畸变校
铸件浇注,就是将熔化好的液态金属,在重力或其它的力的作用下,通过浇口杯注入到铸件模型中,当型腔中的金属液冷却后,敲落型腔得到铸件毛坯的过程。目前在许多生产单位中,主要是靠工
信号分析的主要目的是研究和表征信号的基本性质,而信号的表示方法直接影响到信号分析的结果和效率,因此人们期望寻找最有效和最能揭示信号本质特征的信号表达方式。   信号
空空导弹是现代化战争中夺取制空权,取得战争胜利的重要武器装备之一。舵机作为空空导弹的重要组件,既是导弹制导系统的执行机构,又是导弹制导回路的重要组成部分。 当今,舵机