【摘 要】
:
自主代客泊车应用场景封闭,场景内车辆行驶速度低,被认为是自动驾驶领域最先实现应用的技术。路径规划作为自主代客泊车系统的关键组成模块,主要作用是计算出一条从停车场外的起点位置到目标停车位位置的避障路径。随着车辆保有量的增加,车辆的不确定行为增多,停车场环境变得愈发复杂,传统路径规划方法存在响应速度慢和规划效率低等问题,难以应对动态的变化,而深度强化学习直接与环境交互,具有较强的自学习能力,能够完成复
论文部分内容阅读
自主代客泊车应用场景封闭,场景内车辆行驶速度低,被认为是自动驾驶领域最先实现应用的技术。路径规划作为自主代客泊车系统的关键组成模块,主要作用是计算出一条从停车场外的起点位置到目标停车位位置的避障路径。随着车辆保有量的增加,车辆的不确定行为增多,停车场环境变得愈发复杂,传统路径规划方法存在响应速度慢和规划效率低等问题,难以应对动态的变化,而深度强化学习直接与环境交互,具有较强的自学习能力,能够完成复杂环境的连续规划任务,因此研究深度强化学习在自主代客泊车中的应用非常具有实际意义。基于以上背景,本文针对自主代客泊车的路径规划任务,基于深度强化学习设计了TD3路径规划算法,并在停车场仿真环境中进行测试,实验结果表明TD3算法相比其他深度强化学习算法收敛速度更快,但仅限于小规模的停车场仿真环境;为了完成较大规模仿真环境的路径规划任务,本文提出了Leader_TD3分层深度强化学习路径规划算法,算法基于停车场先验地图,上层使用“连通区域分析+膨胀层+PRM”的方法,将全局路线分割成由采样点构成的局部路径,并将采样点作为Leader反馈给底层TD3深度强化学习算法,由训练完备的TD3算法完成相邻采样点之间的局部路径规划。为验证算法的可行性,本文基于Gazebo搭建了具有物理引擎的3D停车场仿真环境。针对算法在3D仿真环境中出现的训练周期长和难收敛的问题,本文搭建了观测状态和奖励函数保持一致的2D停车场仿真环境,将算法初期的开发和优化工作部署到2D仿真环境中,使用迁移学习将2D仿真环境中训练好的最佳算法模型迁移到3D仿真环境。实验结果证明这种迁移学习的方法显著提高了算法的收敛性。为验证算法的优越性,本文选取“A*+DWA”传统路径规划算法与本文提出的算法进行对比,并针对本文任务制定了评价的指标。实验在不同规模大小的仿真环境中进行,实验结果证明Leader_TD3分层深度强化学习路径规划算法相比于传统算法,在完成率、规划总长度和规划用时上都具有一定的优越性,可以应对复杂的停车场环境。
其他文献
老河口市地处鄂西北门户,汉水之滨,具有得天独厚的农业发展优势。老河口市大仙桃产业自上个世纪九十年代末诞生以来,历经二十余年的发展,取得了辉煌的成就。但近年来,随着湖北省内外鲜桃种植业的蓬勃发展和种植技术的快速更新,使得老河口大仙桃产业的竞争力遭受较大的冲击。为维护老河口大仙桃产业固有的优势地位,提升其产业竞争力,本文以波特“钻石模型”理论为基础,并结合我国经济发展的特点对其进行修正,利用修正“钻石
冠脉造影能实时提供清晰的冠状动脉解剖成像,OCT可以详细评估管腔尺寸、斑块形态等信息,在一定程度上克服了冠脉造影的不足,将冠脉造影和OCT图像进行配准融合,使两种成像技术优势互补,对临床治疗具有重要意义。针对现有的冠脉造影和OCT图像配准方法的不足,本文提出了一种新的基于管腔和分支分割的冠脉造影与OCT图像的配准方法,主要工作总结如下:(1)根据冠脉造影图像和OCT图像的特点,本文提出了一种基于管
受出生率降低、退休人员增多和人均寿命延长等因素影响,在可预见的未来下,我国基本养老保险基金的支付正面临着极大挑战,然而经济发展的不均衡导致了地区之间基金支付情况和结余情况差异极大。因此,2018年国务院决定实行基本养老保险中央调剂制度。中央调剂制度对于平衡地区之间养老保险基金支付、补足部分省市支付缺口有着重要的意义,且制度落实后对各省份基金的影响各有不同。本文的目的是探索中央调剂制度对各省基金收支
计算机断层(Computed Tomography,CT)成像技术具有无痛无创、病态显影清晰、成本较低等优点,已被广泛应用于现代医学临床诊断治疗领域。但CT成像时过高X射线扫描剂量带来的辐射危害越来越被重视,低剂量下CT扫描成像的质量保障已经成为临床应用中急需解决的实用问题。扫描剂量降低后会使重建图像的质量变差,影响医生的诊疗判断,因此,在满足图像质量达标的前提下尽可能地降低CT扫描剂量具有重要的
随着互联网产业的发展,网络直播成为了一种新型网络文化形式。网络直播吸取和延续了互联网的优势,如今已经开始得到广泛应用。网络直播行业凭借着大量融资迅速崛起。我国网络直播行业虽然在监管部门的引导下逐步走向合法化、合规化,但是仍存在诸多问题与风险。审计作为对经济活动的有效监督手段,可以对网络直播公司的经营活动进行监管从而引导网络直播行业健康稳定地发展。本文在对国内外相关文献进行梳理的基础上,从注册会计师
2008年9月,国务院国资委发布《关于规范国有企业职工持股、投资的意见》,对国有企业股权激励的相关事项加以指引和规范。经历了十多年的发展,国企改革取得了重大进展。国有控股上市公司的股权激励计划,因为特殊的产权性质受到了严格的政策限制,多以限制性股票激励为主,且学者们尚未对股权激励的实施效果达成一致意见。中国建筑股份有限公司(以下简称“中建股份”)于2013年4月24日首次实施限制性股票激励计划至今
手足口病(Hand-foot-mouth disease,HFMD)是一种病毒性传染疾病,主要感染婴幼儿,成年人有时也会感染,是严重的公共卫生健康问题。引起手足口病的病毒有多种,肠道病毒71型、柯萨奇病毒A组4、5、9、10型以及B组2、5型。但是引起手足口病最常见的病毒为肠道病毒71型、柯萨奇病毒A组6型和A组16型。为了预防手足口病的暴发,研制手足口病的疫苗至关重要。重组蛋白疫苗因其安全性高,
磁固相萃取技术(Magnetic solid phase extraction,MSPE)以磁性分离替代传统固相萃取的过滤离心等步骤,相对固相萃取而言更为便捷迅速,被广泛应用于样品的预处理方面。生物质材料是自然界中的天然产物,不同的生物质材料结构赋予其独特的物理化学性质,具有对生态环境友好、经济廉价的优点的生物质材料在样品分离分析方面的应用已多有报道。低共熔溶剂(Deep eutectic sol
功率集成电路(PIC)正逐步向更大功率处理能力、更高工作温度、更高工作频率和更低功率损耗的方向发展。碳化硅器件具有更佳的材料和电热学性能优势,是研制功率集成电路更优的选择,已经成为学科研究前沿。碳化硅横向双极结型晶体管(SiC LBJT)以其耐温高且没有栅氧可靠性相关的问题,电路设计相对简单,制备工艺成熟的优势成为设计功率集成电路的重要选择之一。对于功率集成电路设计而言,最大的挑战在于建立准确的器
肥胖与慢性代谢性疾病如非酒精性脂肪肝及慢性肾病的发生发展密切相关。为了解析肥胖诱发慢性肝肾疾病致病机理,并寻找潜在靶位点为缓解甚至逆转肥胖相关代谢疾病,我们于细胞层面展开了相关研究。在本文中,我们用油酸处理构建了脂质过载的肝肾细胞模型,并通过蛋白印迹技术鉴定到载脂蛋白J在脂质过载细胞中高表达。基于我们课题组前期对于载脂蛋白J在丙型肝炎诱导的肝脏脂质积累上的作用研究,我们推测载脂蛋白J在油酸诱导的肝