【摘 要】
:
随着我国城市化建设的不断深入,大量人员和车辆涌入城市,城市交通变得异常拥堵。日益上升的拥堵情况给城市的经济发展和居民生活带来了严重的负面影响,同时也制约着我国城市化建设进程的发展。造成交通拥堵的因素有很多,如交通信号控制问题、交通路线诱导问题、汽车数量增长问题、交通基础设施不完善的问题等。本文针对交通信号控制问题,运用聚类算法结合深度强化学习实现自适应式的控制交通信号的决策,并重点解决在高饱和路网
论文部分内容阅读
随着我国城市化建设的不断深入,大量人员和车辆涌入城市,城市交通变得异常拥堵。日益上升的拥堵情况给城市的经济发展和居民生活带来了严重的负面影响,同时也制约着我国城市化建设进程的发展。造成交通拥堵的因素有很多,如交通信号控制问题、交通路线诱导问题、汽车数量增长问题、交通基础设施不完善的问题等。本文针对交通信号控制问题,运用聚类算法结合深度强化学习实现自适应式的控制交通信号的决策,并重点解决在高饱和路网中潜在的拥堵问题。首先,因为交通路网中的交叉口之间存在关联性,所以为了避免因个别重要交叉口疏通不利而导致的拥挤情况扩散至整个路网的问题,本研究将全局的路网作为卷积神经网络的感受范围,并针对实际交通路网存在的路网规模大、结构不规则的问题,运用聚类算法将路网进行聚类处理,并建立多个互相关联的感受野。同时,考虑到深度学习在图像感知上的优秀表现,本研究通过卷积神经网络感知道路拓扑结构的空间特征,将规范化后的感受野作为输入,以便更好的感知路网状态。本研究将交叉口作为执行深度强化学习策略的智能体,运用深度强化学习模型预测各交叉口应采取的动作,交叉口通过不断地与路网环境进行交互试错,逐渐在交通数据中学习到有利于全局路网信号决策的知识,建立深度强化学习的机制,累积学习经验,最后达到提高路网内车辆通行能力、缓解交通拥堵的目的。本研究通过SUMO平台对城市交通路网进行模拟试验,在车辆平均等待时间和路网中车辆总数两个策略评价指标下,将提出的策略与基于强化学习的控制单交叉口策略和基于强化学习的控制协同交叉口策略进行对比。实验结果表明,改进的基于深度强化学习的协同多感受野的交通配时方法在高饱和的路网中均优于上述两种方法,并能够更好的缓解交通拥堵情况。
其他文献
政府部门绩效信息是社会各界了解其资金使用现状的依据,有利于提升政府治理能力和财政透明度,继而提升社会公众满意度。实施全面预算绩效管理有利于政府完善预算支出结构、披露更多财政信息,但是在中央推行过程中,地方政府存在着对政策理解不准确、执行不到位等突出问题,导致政府部门在绩效评价指标体系设计上存在缺陷,使绩效评价无法发挥应有作用。尤其是公安局的工作绩效直接影响国家政治、经济和社会秩序的稳定以及社会公众
如今互联网高速发展,伴随它而生的信息服务更是同样发展迅速,但这背后却存在一些问题。人们在使用网络时会留下大量的数据信息,这些数据增长速度非常快,从而造成网络中的信息十分冗余,人们就不能快速的、精准的搜到自己想要的内容。个性化推荐系统的出现便较好地改善了这一问题,给人们在使用网络时带来了便利。因此作为推荐系统的核心,推荐算法的性能显得尤为重要,但传统的协同过滤推荐算法会随着系统本身规模的扩大,数据不
气动声场中声的传播以及声场特性目前人们主要采用理论解析和数值计算,并没有脱离两类框架。本文尝试采用量子力学的方法建立宏观气体声场声传播的微观模型,研究其量子分子特性
摘 要:本文从深入开发教材,有效选择问题,结合问题实现有效启发;培养科学思维和深入开发导学案,四个方面探究“问题导学”方法。 关键词:高中物理;核心素养;问题导学;开展研究 在如今,随着新课程改革的推进,学生核心素养培养对于学生发展的作用被越来越多的教师所认可,相应的如何实现对学生核心素养的有效培养就成为了教师所研究的重点内容。而对于高中物理来说,其难度较高,学生很容易对物理的学习产生畏惧心理
当今时代是知识经济时代,市场的竞争是人才的竞争.企业要发展就必须强化员工培训,这一点已得到了众人共识.企业的培训市场需求极大,但缺乏规范,培训实效低,培训方法单一,企业