基于多目标协同演化算法的大规模自动驾驶策略涌现

来源 :中国科学院大学(中国科学院深圳先进技术研究院) | 被引量 : 0次 | 上传用户:tedious
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在无人驾驶与网联汽车快速发展的背景下,车辆逐步具备通信、感知和决策能力,车辆与车辆、道路之间均可以直接或间接进行交互。交通系统呈现出规模大、动态性高、高度可变性、不确定性的特点。传统交通规则难以对交通状况作出及时响应以及对车辆作出合理规划和调度。然而,中心化的优化调度方法,计算复杂度将随交叉口数量、车辆、道路网络复杂性以及车辆之间可能的冲突关系呈指数增长。即使未来的计算能力足够大,由于信息传输的延迟、丢失和计算时间,中心化服务器也很难实时响应请求。由于交通网络的高动态性与车辆响应的瞬时变化,几乎不可能以中心化优化方法及时处理真实的交通事件和调度规划网络中的车辆。由于传统的演化算法(遗传算法等)和一些智能优化算法(比如蚁群算法、粒子群算法、模拟退火算法等)仅包含一个种群,不能充分考虑竞争合作的影响,在规模扩大时,不易收敛或收敛速度较慢。另一方面,中心化优化算法的计算复杂度过高,无法处理大规模的交通优化问题。因此,基于协作与竞争的方法,协同演化算法被期望用于进行自适应的演化进程来处理各种不同的大型交通场景。本文提出了一种将协同演化和群体智能相结合的算法,基于驾驶策略空间部分,构造多个协作竞争的种群,设计了多目标奖励函数,在模拟的环境下协同演化,并观察优势驾驶策略的涌现。我们建立了一个网格道路模型和车辆运动学模型,其中各个车辆之间以间接交互的方式进行交互,使得计算复杂度与模拟的车辆规模大小呈线性关系。在此基础上,我们引入了基于q态模型的中间策略,并以变道因子(在没有足够的空间下变道的概率)描述中间策略,丰富了自动驾驶策略环境。此外,我们还基于合作博弈理论分析了策略联盟的稳定性和收益,并给出了各种交通密度条件下的策略表现的下限。在模拟环境下,在4.5公里的道路上进行了不同交通流密度下(车辆数目为170,340)的实验,结果表明:在不同的交通流密度下,胜出策略不同。在较高的交通流密度下,理性的策略可以达到最佳效果,激进的策略产生的事故最高,平均速度略高。保守的驾驶策略表现最差,很快就被淘汰。而在较低的交通流密度下,保守策略由于其低速的特点很快被淘汰;激进策略产生的事故极少,平均速度处于较高水平;理性策略几乎不引发交通事故,速度与激进策略相差不多,理性策略与激进策略在演化进程中均表现较好。采取最佳策略后,事故总数和平均速度均取得了大幅提升,事故率降低了一个数量级,为万分之0.5以下,平均速度得以显著提升,由13.8m/s提升到了16.3m/s,提升30%。在引入q态模型的中间策略后发现,总体收益函数得分得到进一步提升,事故率和平均速度也有进一步改善。该结果对于使用未来的智能交通系统和智能车辆设计驾驶策略具有良好的启发性。由于我们方法的计算复杂度与车辆数量呈线性关系,并且可以并行处理,因此可以扩展该方法以探索包含数百万辆自动驾驶汽车的城市交通最佳驾驶策略。
其他文献
随着东莞经济的快速发展,东莞电网的规模也在不断扩大,电网检修、设备缺陷、方式调整及新设备投运等电网日常业务引发的设备操作工作量迅猛增长,电网的运行控制越来越复杂。
农业是我国的第一产业,是国民经济建设与发展的基础产业。水稻是人们最主要的粮食作物之一。水稻的基因组研究对发展现代农作物育种技术、保障粮食有效供给具有重大意义,选育产量高、抗逆性好、营养物质利用率高的水稻新品种是新时代水稻育种和栽培领域的重要目标,向遗传学家和育种专家提供一套自动化、高效且精确的表型检测方法具有实际意义。近几年,计算机视觉技术在作物表型领域有相当广泛的应用,通过图像处理技术来提取样本
自学考试制度作为一种证书检验与鉴定制度,具有对象的开放性、方式的灵活性、运作的统一性、结果的权威性特点;作为一种证书培训与教育形式,具有教育资源组织充分、侧重提供
大学的文化氛围决定着所培养出来的学生的素质。良好的学术氛围对提高研究生的培养质量至关重要,高校构建良好的学术氛围是一项艰巨的系统工程,对研究生的培养要以提高其综合
气象是我国古代文论系统中的核心范畴之一。本文从范畴研究入手,探讨宋代文论气象范畴的内涵定义与审美特征。运用了文献研究法来搜索整理气象文献,文本分析法来缕析气象观,