【摘 要】
:
传统驾驶过程中的超车行为,复杂程度高、动作连续性强,稍有操作不当便会引发交通事故。现有的无人驾驶超车控制技术,大多是基于人类驾驶规则,采用物理建模的方式实现,其模型不具备自适应学习能力,无法实时调整控制策略,对复杂的道路交通环境鲁棒性较差。因此,研究超车控制策略模型的交互式训练学习方法,就显得尤为重要。本文基于深度强化学习的DDPG算法思想,提出一种无人驾驶汽车超车控制策略的交互式训练学习方法。采
论文部分内容阅读
传统驾驶过程中的超车行为,复杂程度高、动作连续性强,稍有操作不当便会引发交通事故。现有的无人驾驶超车控制技术,大多是基于人类驾驶规则,采用物理建模的方式实现,其模型不具备自适应学习能力,无法实时调整控制策略,对复杂的道路交通环境鲁棒性较差。因此,研究超车控制策略模型的交互式训练学习方法,就显得尤为重要。本文基于深度强化学习的DDPG算法思想,提出一种无人驾驶汽车超车控制策略的交互式训练学习方法。采集智能驾驶员的超车控制数据对模型进行预训练,然后使用经验数据约束处理对传统~*Q算法进行改进(简称“~*Q_EP1算法”),并进行超车控制策略模型的正式训练。~*Q_EP1算法较传统~*Q算法在缩小数据规模及提升数据质量方面有显著提高,但训练效率低,为解决此问题,基于聚类分析方法对~*Q_EP1算法进行进一步改进,提出了Q~*_EP2算法。该算法采用二分K-means对一个较小的超车控制数据集进行聚类分析及处理,获得聚类模型M,利用模型M聚类训练数据,并从已聚类的每一个类别中按等间距、等比例、随机抽样的原则,抽取最具代表性的数据训练超车控制策略模型。Q~*_EP2算法不仅缩小了数据规模、提高了数据质量,而且还避免了数据冗余。仿真实验分析表明,~*Q_EP2算法能够有效提高超车控制策略模型的学习性能,包括训练效率、超车控制性能和泛化能力。在100次试验中,Q~*_EP2算法比~*Q_EP1算法训练时间缩短了75%左右,训练效率远超传统~*Q算法。并且在复杂程度远高于训练道路的测试道路上进行20圈(大约88km)的仿真实验,其超车次数比~*Q_EP1算法高出18次,比传统~*Q算法高出21次。此外,通过试探性研究和单因素分析法,对相对最优的经验池大小、聚类数量和抽样比例进行求解,并在此配置条件下完成了一次直到Q~*_EP2算法收敛的仿真实验。实验结果表明,在相对最优的参数配置条件下,~*Q_EP2算法训练效率更高、收敛速度更快,其收敛时花费的迭代成本还不到传统~*Q算法的43.2%。本文提出的Q~*_EP2超车控制策略算法,训练效率高、泛化能力强、收敛速度快、超车控制性能好,对无人驾驶超车控制研究具有一定的借鉴意义。
其他文献
针对我国服装网络营销的现状,结合阿里巴巴运用VR技术最新推出的Buy+项目,分析VR技术在服装网络营销中应用的可行性及影响,为相关研究提供一些参考建议。
本文分析了AGV机器人在运行过程中产生的定位误差的原因,并对定位误差进行分析。提出了一种基于卡尔曼滤波理论理论的AGV机器人多传感器融合算法。
目的:胰腺癌是一种高致死率的疾病,恶性程度高,早期诊断困难,手术切除率低,对放化疗不敏感,容易复发和远处转移,预后极差。IKBKE属于IκB激酶家族中非经典IκB激酶的一种,也属于丝氨酸/苏氨酸蛋白激酶,其主要通过调节干扰素和NF-κB信号通路在人体先天免疫中起着重要的调节作用。同时也发现IKBKE在多种恶性肿瘤中作为致癌基因参与肿瘤的发生发展及恶性转化等过程。本课题主要研究IKBKE和NF-κB
目的探讨盐酸二甲双胍与门冬胰岛素联合治疗对妊娠期糖尿病孕妇血清胱抑素C、同型半胱氨酸及母婴结局的影响,为临床治疗提供一定依据。方法回顾性分析90例符合纳入标准的妊娠
辽宁省位于我国东北南部,地质工作程度相对较高,是我国矿产资源开发较早的省份之一。省内矿产资源丰富,已知铁矿、煤矿、有色金属矿、非金属矿和各种能源矿产100余种。本次研究所处的辽东南地区大地构造位置位于华北克拉通北缘东段,属于东北地区金属及非金属成矿重点区之一。辽宁省西部地区大地构造位于中朝准地台(Ⅰ)燕山台褶带(Ⅱ)辽西台陷(Ⅲ)朝阳穹褶断束(Ⅳ)的南半部。本次研究基于区域成矿地质背景分析,选择区
农村金融的健康有序发展,是农村地区实现经济转型跨越发展的前提保障和有力支撑,对于全面实现小康社会具有重大的战略意义。作为新型农村金融组织模式的农村互助金融是和农村
<正> 中药桑寄生是我国古代常用药品之一,早在2300年前的“神农本草经”已有关于它的记载,当初以寄生在桑树上的作药用,后来发现并不是专寄生在桑树的,而且不容易分别。到了
<正>所属课程:《小小"品评家"》所属专业:小学美术授课课时:一课时小小"品评家"教学设计教材分析:生活中不是缺少美,而是缺少发现美的眼睛。训练学生拥有一双善于发现的眼睛,
<正>江西鄱阳湖国家级自然保护区成立于1983年,主要职能是保护鄱阳湖以白鹤为代表的珍稀候鸟和湿地生态环境。保护区内湿地生态系统结构完整,生物资源丰富,有哺乳动物45种、
在当今的时代,高效、飞速,智能化已经成为了这个时代的代名词,对于机械加工的复杂性,零件的多样性,产品的周期性发展问题,3D打印技术的出现给科学技术带来了质的飞跃。3D打印技术通俗的讲就是增材制造技术。与传统的加工方式来说,3D打印技术以其生产周期短、一次成型、高效率等优势脱颖而出。FDM技术的发展作为3D打印技术中较为成熟的技术之一,它本身所具有的优势是比较于其他的打印技术来说,具有低成本、结构效