基于深度强化学习的自动驾驶系统设计与实现

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:yiteng89
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动驾驶技术一直是人工智能领域研究的热点之一。传统模块化方法受限于驾驶环境的复杂,难以做出系统性设计;基于监督学习的深度神经网络方法通过学习人类驾驶记录,虽然可以模仿出人类驾驶动作,但受限于驾驶记录的广泛性,泛化能力不强;深度强化学习方法通过智能体与环境交互不断进行学习,在仿真环境下可以探索到各种可能发生的情况而无需数据集的支持。因此本文结合深度强化学习,采用端到端方法对自动驾驶系统进行研究并实现了对应的自动驾驶系统。针对传统强化学习在高维连续空间探测效率低的问题,我们设计了先模仿学习后强化学习,精简状态异构融合的学习方法。模仿学习阶段,利用驾驶数据学会将高维图像信息降维为低维图像特征,连同描述环境的关键特征全面表示车辆状态,并采用分级整合连接的方式异构融合这些特征。强化学习阶段,采用深度确定性策略梯度算法(DDPG)并为自动驾驶场景量身定制了奖励函数以引导学习过程。经实验验证,该系统可以有效习得驾驶技能,基于异构融合特征的设计可以有效加速训练过程,该系统不仅可以完成一定的驾驶任务,而且具备了对动态物体的响应能力。为了进一步优化自动驾驶方法,我们引入分支决策网络来解决导航问题。通过仿真平台提供的全局导航信息将分支决策网络设计为直行、左转、右转、道路跟随四种状态,每种状态相对独立训练。针对分支导航信息进一步优化了奖励函数,并参照Co RL2017评估标准对系统性能进行了测试。实验结果显示,我们所使用的方法与基准方法相比,整体上具备一定优势,任务成功完成的比例较高,尤其在不同天气变化下仍有较为优秀的表现。针对自动驾驶系统在复杂环境下表现不够优秀的问题,采用潜状态时间序列模型对环境建模,使用照相机与雷达信息融合的方式进一步精准描述空间环境信息,为此使用软式演员评论家强化学习算法(SAC)进一步优化自动驾驶系统的决策能力。同时,引入二维语义鸟瞰图作为系统对环境理解的可视解释。实验表明,该方法可以在有大量动态物体的复杂环境下学习驾驶技术,相关性能指标优秀。系统生成的语义鸟瞰图可以较为准确地描述周围环境信息,有效地表示了系统对当前环境的理解。本文从强化学习算法框架、输入特征形式和奖励函设计等方面综合研究了基于深度强化学习的自动驾驶系统设计。三种方案针对不同任务,互为补充,通过在CARLA自动驾驶仿真平台的实验证实,本文所用方法可以有效地学习自动驾驶技术,提升了强化学习算法在自动驾驶任务上的表现。
其他文献
学位
近年来,窄线宽光纤激光器因其良好的时间相干性、高光束质量、结构紧凑和噪声低等特点备受关注。然而随着激光功率的不断提升,光纤中的非线性折射效应(例如自相位调制效应,SPM,Self-Phase Modulation)已成为阻碍窄线宽激光器向更窄线宽发展的主要因素。因此如何抑制窄线宽光纤激光器中SPM效应已成为高功率光纤激光器领域亟需解决的重要难题。为解决这一难题,本文提出了一种利用相移长周期光纤光栅
应急救援装备在长时热辐射环境中实现设计功能是救援行动的基本保障,长时热辐射环境可能导致消防头盔、灭火防护服性能下降,严重威胁救援人员的生命健康,因此需要系统探究消防头盔、灭火防护服在热辐射环境下的性能变化。本文利用多种测试手段,对不同热辐射通量作用下消防头盔及灭火防护服的性能变化、内外温升变化进行研究,以不同热辐射通量作用下的性能变化作为评估矩阵,通过建立事故树,获得消防头盔及灭火防护服的故障分析
水下目标识别技术是开展水下作业的重要保障,在军用和民用领域都发挥着重要作用。根据信息获取方式的不同,水下目标识别技术分为水声探测技术和光视觉探测技术。相较于水声探测,光视觉探测具有探测目标直观、分辨率高、实时性能优良等诸多优点,具有广泛的应用前景。然而,水体及水中杂质对光信号有着强吸收和强散射作用,严重破坏了水下光视觉探测的清晰度,限制了水下目标识别距离。因此如何有效降低水体及水中杂质对光信号强吸
纳米金属因其独特的结构特征和众多优异的力学和物理性能,在过去的三十年间受到了材料科学界和工业界的广泛关注。至此,材料学者们已经发展出一系列的纳米金属材料制备技术,涵盖“自上而下”和“自下而上”的路径,由此得以深入研究纳米金属的新颖物理化学现象和揭示其复杂的结构-性能关系。目前,纳米金属领域的研究仍然面临一些重要问题,其中包括超细晶/纳米晶金属普遍因缺乏加工硬化能力而拉伸塑性不佳;人们对塑性变形引起
糖尿病是一种代谢疾病,患者的身体因无法产生足够的胰岛素从而导致血液中葡萄糖浓度升高,并引起各种并发症。世界卫生组织发布的一份报告表明,近年来糖尿病的发病率一直在迅速增加,正成为一个严重的全球医疗保健问题。在糖尿病的预防和治疗中人体血糖浓度的准确检测起着十分重要的作用。因此,快速、经济、可靠地检测血糖浓度已成为该领域的研究重点。到目前为止,用于葡萄糖浓度检测的葡萄糖传感器经历了四代的发展,第四代无酶
摩擦磨损广泛存在于工业,科技以及日常生活中,造成严重的资源和能源浪费。离子液体凭借优异的物化特性可以在传统润滑剂无法适用的苛刻工况下使用,在润滑剂领域受到广泛的研究。当离子液体在固体表面处形成纳米厚度液膜时,固体近表面处离子液体的性质,即结构和作用,与体相离子液体迥异,此时主要依据连续介质力学和材料体相性质的宏观摩擦学已无法适用,需要从纳米尺度分析微观结构-作用变化及其对纳米摩擦性能的影响。离子液
搅拌摩擦焊属固相连接技术,具有热输入低、焊接变形小、接头质量高等优点,被用于有色金属及异种金属的焊接。铜(Cu)、铝(Al)等属工业常用有色金属,Cu/Al复合结构广泛用于电力、能源等领域。采用搅拌摩擦焊能够获得性能优良的Cu/Al异种金属结构,但目前针对Cu/Al异种金属搅拌摩擦焊的研究往往只针对单一方向,缺乏系统性。因此,本文针对Cu/Al异种金属搅拌摩擦焊展开系统研究,从温度场特征、焊接特性
在过去几十年间,含能材料领域的研究人员合成了许多高能量密度材料(HEDM)。由于对含能材料不仅有能量要求,在生产、运输和应用过程中还有安全稳定性和环境友好性等要求,因此,近年来,以杂环为基本骨架的能较好地满足这些要求的含能化合物引起了人们的广泛关注。本论文选取五元杂环中兼具高能量和高稳定性的1,2,4-噁二唑环和1,2,3-三唑环为基本骨架,设计合成了系列含能化合物及其含能离子盐,并对它们的结构和
在现代社会,人们的物质生活和经济水平不断提高,对物质的追求也逐渐成为人们生活的方向标。但是,物质化的经济追求也封闭了人们通向灵魂的大门,人们在对工具理性的追求中遮蔽着、异化着生命的成长,生命成长迷失方向,导致人们在日益富裕的物质生活中越发感受到生存的困顿——诸如环境污染、资源枯竭、能源短缺、气候恶化、瘟疫发生、人的精神荒芜、社会风险增加等。所以,现代人已被放逐的心灵迫切需要回归到生命存在本身。因为