论文部分内容阅读
在无人驾驶与网联汽车快速发展的背景下,车辆逐步具备通信、感知和决策能力,车辆与车辆、道路之间均可以直接或间接进行交互。交通系统呈现出规模大、动态性高、高度可变性、不确定性的特点。传统交通规则难以对交通状况作出及时响应以及对车辆作出合理规划和调度。然而,中心化的优化调度方法,计算复杂度将随交叉口数量、车辆、道路网络复杂性以及车辆之间可能的冲突关系呈指数增长。即使未来的计算能力足够大,由于信息传输的延迟、丢失和计算时间,中心化服务器也很难实时响应请求。由于交通网络的高动态性与车辆响应的瞬时变化,几乎不可能以中心化优化方法及时处理真实的交通事件和调度规划网络中的车辆。由于传统的演化算法(遗传算法等)和一些智能优化算法(比如蚁群算法、粒子群算法、模拟退火算法等)仅包含一个种群,不能充分考虑竞争合作的影响,在规模扩大时,不易收敛或收敛速度较慢。另一方面,中心化优化算法的计算复杂度过高,无法处理大规模的交通优化问题。因此,基于协作与竞争的方法,协同演化算法被期望用于进行自适应的演化进程来处理各种不同的大型交通场景。本文提出了一种将协同演化和群体智能相结合的算法,基于驾驶策略空间部分,构造多个协作竞争的种群,设计了多目标奖励函数,在模拟的环境下协同演化,并观察优势驾驶策略的涌现。我们建立了一个网格道路模型和车辆运动学模型,其中各个车辆之间以间接交互的方式进行交互,使得计算复杂度与模拟的车辆规模大小呈线性关系。在此基础上,我们引入了基于q态模型的中间策略,并以变道因子(在没有足够的空间下变道的概率)描述中间策略,丰富了自动驾驶策略环境。此外,我们还基于合作博弈理论分析了策略联盟的稳定性和收益,并给出了各种交通密度条件下的策略表现的下限。在模拟环境下,在4.5公里的道路上进行了不同交通流密度下(车辆数目为170,340)的实验,结果表明:在不同的交通流密度下,胜出策略不同。在较高的交通流密度下,理性的策略可以达到最佳效果,激进的策略产生的事故最高,平均速度略高。保守的驾驶策略表现最差,很快就被淘汰。而在较低的交通流密度下,保守策略由于其低速的特点很快被淘汰;激进策略产生的事故极少,平均速度处于较高水平;理性策略几乎不引发交通事故,速度与激进策略相差不多,理性策略与激进策略在演化进程中均表现较好。采取最佳策略后,事故总数和平均速度均取得了大幅提升,事故率降低了一个数量级,为万分之0.5以下,平均速度得以显著提升,由13.8m/s提升到了16.3m/s,提升30%。在引入q态模型的中间策略后发现,总体收益函数得分得到进一步提升,事故率和平均速度也有进一步改善。该结果对于使用未来的智能交通系统和智能车辆设计驾驶策略具有良好的启发性。由于我们方法的计算复杂度与车辆数量呈线性关系,并且可以并行处理,因此可以扩展该方法以探索包含数百万辆自动驾驶汽车的城市交通最佳驾驶策略。