基于深度强化学习的智能交通信号控制方法研究

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户:wangxun416
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
交通拥堵已经对全球经济、环境的健康可持续发展造成了严重的影响。交叉路口作为城市交通路网的关键节点,是发生交通拥堵的主要区域,因此如何提升交叉路口的交通信号控制效率,是有效缓解城市交通拥堵的关键。传统的交通信号控制主要从规则和模型两方面来优化交通信号控制参数,存在诸多理想的假设不符合实际交通状况,控制效果欠佳。近年来,随着大数据技术的发展获取丰富多样的交通数据、算力的增强和人工智能技术的成熟,以数据驱动为导向的交通信号控制方法成为新的研究方向,其中结合深度强化学习的交通信号控制优化方法是最主要的研究热点。虽然已经有很多基于深度强化学习的交通信号控制优化算法被提出并且取得了较好的效果。但是,现有的控制算法依然存在以下不足:(1)针对单交叉路口的信号控制研究多采用结构化的交通状态表示,存在着信息描述准确性不足、交通状态节点关系感知能力不足等问题。(2)现有基于深度强化学习的信号控制研究中多使用当前时刻的交通状态进行训练,忽略了交通流的时序特征,在交通流变化较大的情况下控制效果有限。(3)针对区域路网多交叉路口的交通信号控制的研究中,存在着复杂路网下交通状态维度过高以及智能体之间的协调通信花费时间过长严重影响路网通行效率的问题。针对以上问题,本文开展的研究工作如下:1.提出一种基于双重注意力机制异构图深度强化学习的交通信号控制方法。将基于节点级与语义级注意力机制的异构图神经网络和强化学习相结合,通过图神经网络在非欧式空间数据中强大处理能力,挖掘交通节点内部潜在关联特征和自动关注重要的状态分量以增强网络的感知能力,为强化学习决策推理与状态预判提供潜在信息支持做出精准信号控制决策。实验结果表明,与其它先进算法相比,本文所提算法在多个交通性能指标上均有提升。2.提出一种基于BGRU交通流预测深度强化学习的交通信号控制方法。首先,利用独热编码设计简洁且高效的交通状态,对当前的交通状态进行精确刻画;其次,针对当前的交通状态,使用双向门控循环单元预测未来的交通态势,将预测的下一时刻的交通状态作为增广信息和当前交通状态相结合作为信号控制算法的输入;最后,使用基于DQN的深度强化学习算法对结合当前和未来交通信息的增广交通状态进行交通信号最优控制决策。实验结果表明,本文所提算法与基于深度强化学习的交通信号控制基准算法相比,在多个交通性能指标上均优。3.提出一种基于数字孪生使能的深度强化学多交叉路口信号控制方法。首先,搭建了四层架构的交通路网多交叉路口信号控制数字孪生体系架构,通过实时的信息传输和数据融合,实现真实交通路网从物理空间到数字空间的映射,构建交通网络的数字孪生体;其次,建模基于图神经网络深度强化学习的数字孪生模型,实现真实交通路网和数字孪生体交通网络的虚实交互;最后,以交通路网的最大通行效率为优化目标训练单一智能体对多路口路网进行全局信号控制。实验结果表明,本文所提算法在多个交通性能指标上均优于基于深度强化学习的多路口交通信号控制基准算法。
其他文献
随着“双减”政策的提出,教育教学方式要进行新的改革和完善。小学阶段是学生成长和发展的一个重要时期,教师在落实“双减”政策的过程中,要注重提升学生的学习质量和教学效率。而信息技术的高度发达为小学语文课堂提供了新的教学方式,将信息技术融合到小学语文课堂上,可以为学生营造一个适合的教学情境,调动学生对语文学习的积极性,让学生能够找到适合自己的学习方法,减轻学生的学习和作业负担,从而落实“双减”政策,促进
期刊
合理的通风模式被认为是确保规模化猪场实现最佳生产性能的重要策略之一。传统规模化猪舍通风模式比较粗放,存在夏季猪只体感风速较小,冬季舍外冷空气进舍预热不够,舍内不同区域、不同时间温差较大和空气质量差等现象,导致猪只动物福利、健康水平和生产性能低下,饲养人员工作环境差,通风换气能耗较大等问题。论文针对以上规模化猪场因通风模式设计引发的常见问题,以改善猪舍气流组织分布及降低通风换气能耗为突破口,将地道式
学位
E公司是全球领先的直线运动技术解决方案和产品供应商,主要面向医疗设备、自动化生产线、非道路机械以及其他通用设备行业提供直线传动零组件。2020年5月份,E公司管理层制定了2021-2025发展战略,对公司未来5年的发展目标提出了更高的要求。在E公司拥有的众多直线运动产品中,滚柱丝杠具有较高的产品附加值,可以替代传统的液压传动以及普通滚珠丝杠传动方式,为中高端设备提供更加优异的产品表现。在国内市场,
学位
智慧警务平台推广应用是数字时代发展的必然趋势,也是国家科技兴警战略的重要内容。智慧警务平台执法应用有利于提高警务执法效率,精准打击犯罪分子;有助于规范警务执法、降低执法成本;有助于提升执法办案法律效果和社会效果。当前我国智慧警务平台执法应用相关制度规范缺失,警务执法标准不统一,存在警务伦理和数据侵权风险。为此,智慧警务平台执法应用宜确立“以人为本”智能科技法治原则,秉持“以人为中心,以平台为辅助”
期刊
高校海归青年教师是新时代高校教师队伍的重要力量。强化高校海归青年教师对主流意识形态的认同对推进高等教育高水平发展、巩固师德师风建设成效和引导学生健康成长有着重要的价值意蕴。现实中,高校海归青年教师有家国情怀,但对主流意识形态认同不深;有正确价值取向,但与社会现实价值张力较大;有个人价值标准,但对集体事务参与融入不足;等等。可通过强化思想教育、做实人文关怀和加强制度保障等途径不断提升高校海归青年教师
期刊
报纸
城市地铁建设在我国方兴未艾,截至2021年底,中国大陆有55个城市在建线路253条,其中出现了大量岩石地层,如青岛、重庆、大连等等,粗略估计此类地层建设规模超1300公里。而区间隧道在整个地铁土建工程投资中占比一般在60%以上,对工程造价影响较大。对于岩石地层,矿山法以其断面布置灵活,施工组织便捷等诸多优点,应用十分广泛。然而目前矿山法隧道设计和围岩响应的理论较为模糊,且缺乏科学的设计方法,致使工
学位
图像文字识别与理解是计算机技术应用中备受关注的研究问题,在重/轻工业、交通、金融、保险、教育等行业中扮演着基础功能角色。近十年来,深度学习技术有力推动了图像文字与理解技术的快速发展。然而,现有的研究是非系统性的,在算法效能和应用赋能上均是不充分的。算法上,子领域技术联动性不足(例如图像文字感知与理解技术的研究割裂),造成算法上的次优问题;图像文字中的多模态信息发掘不充分,造成算法的抗干扰性不足;除
学位
以肠道微生物组、蛋白质组等组学数据为表征的人体内环境紊乱与2型糖尿病进展紧密相关。探究与2型糖尿病相关的肠道微生物、血液蛋白质标记物及膳食影响因素对于2型糖尿病的预防、治疗及机理解析都具有重要的意义。因此,本论文基于中国人群队列,系统探索研究了肠道菌群与2型糖尿病的横断面关联、前瞻性关联,研究了血液蛋白质组与2型糖尿病进展的关系,发现了一系列新型的肠道菌群以及血液蛋白质标记物,并且评价了膳食营养对
学位
城市内出行需求的不断增加,加剧了交叉口需求与供给之间的矛盾,加之资源的不合理分配,混合交通流运行秩序混乱、交通拥挤等问题开始凸显。交通信号控制方案作为调节交通流释放的短期变量,能够根据交叉口实际合理分配绿灯资源,因而可以有效避免交通拥堵并提高混合交通流通行效率。然而,现有交通信号优化研究中普遍采用基于机动车需求的控制策略,对出口道供给和行人过街需求考虑不足,导致交叉口出现排队溢出和人车混杂现象,资
学位