基于深度强化学习的城市路网交通控制系统设计

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:owenzhong2012
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
城市交通系统是一个庞大的系统,具有随机性、复杂性和不确定性等特性,目前人们难以对交通控制对象建立精确的数学模型,传统的交通控制出现瓶颈,自适应控制系统的出现给城市交通控制带来了曙光,但是国内的交通特征较为复杂,自适应控制系统未能发挥出其最佳作用。随着计算机技术、检测器技术和人工智能技术的快速发展,应用人工智能算法进行交通信号控制受到广大研究者的青睐,特别是基于深度强化学习方法,该方法不需要对交通对象进行建模,通过设计智能体实现策略学习,智能体以提升交通运行状态为目标,通过深度学习感知交通状态,应用强化学习进行控制决策,获得最优的控制策略。本文的主旨是应用深度强化学习方法生成交通信号控制方案。因此,本文首先构建了交通控制的深度强化学习模型,设计了基于交通状态预测的强化学习环境和基于改进QMIX决策的信号控制智能体。然后根据交通信号控制逻辑,设计了交通环境的状态和状态空间,智能体的动作和动作空间以及可表征动作对状态影响的奖励函数。主要研究内容如下:首先,通过对历史交通状态数据和交通路网空间位置进行关联分析,构建一种基于关键路口的子区型交通控制对象。然后,以多智能体技术为基础,利用博弈理论的相关知识,在既有交通控制技术的基础上,对交通控制层级控制对象建模,设计协作控制智能体,并基于协作多智能体对象设计交通控制框架。在交通控制框架内,以提升子区整体控制效果为目标,提出一种基于深度强化学习的交通信号滚动控制方法。该方法充分考虑交通对象的空间关系,采用速度预测的方式进行子区控制动作与交通速度状态函数关系的建立,并设计智能体决策方法。智能体可通过观测局部状态,选出累积期望最大的动作。通过设计相关实验进行方法验证,从控制方案对比与运行效果分析两方面验证了方法可行性。最后,基于上述研究内容,结合用户的需求,设计了交通控制方案滚动生成系统,该系统可实现对生成控制方案的自动下发,很好的辅助了交通信号配时人员。
其他文献
建立健全内部控制,是有效防范和摔制投资风险的关键。与日常业务相比,投资具有个性化特征,有效的投资内部控制必须与这一特征相适应。本文在分析投资控制特点的基础上,从科层结构
通过考察入侵检测系统(IDS)的发展现状及针对目前IDS应用所存在问题,讨论了基于NetFlow技术的骨干网IDS技术,文中首先论述在网络核心层,即骨干网处采用NetFlow技术实现入侵检测
城市化的进程在全国发展迅速,于此同时,大量的用电设备在生活和生产中运用,使得对建筑电气设备的要求越来越高,而低压配电系统是电气设计中一个重要的组成部分,低压配电系统
燃烧是人类获取能源、动力和产生推力的主要手段,加深对燃烧现象的科学理解具有重要意义,而重力对燃烧的影响是是显而易见的。加深对微重力或低重力环境下燃烧现象的研究,有助于提高人类预测和预防火灾的能力,这也是载人航天实践中防、灭火工程的实际需要。目前大部分微重力燃烧实验都是通过地面实验设施实现的,因此受到了微重力时间和微重力水平的限制,而空间站为这些研究提供了完美的微重力环境。2022年左右,中国载人空
目的探究重症监护室呼吸机相关肺炎(VAP)患者的病原菌分布及耐药菌情况.方法回顾性分析在重症监护室发生的56例VAP患者,对患者病原菌培养、药物敏感性实验结果及抗生素使用情
在使用Asp.net设计和开发某学院人事和工资管理系统中,数据库的备份和恢复也是系统必备的功能模块之一,考虑到使用简单方便,本系统中采用脱机完全备份。备份信息记录采用XML
1183名注册志愿者,16767名网络志愿者,他们分工合作服务受助者。2700多名贫困学生得到资助,这些孩子70%是留守儿童,其中女童占62%。透明公开财务,全年办公经费开支不足2万元。这就是