深度确定性策略梯度相关论文
联邦学习是近年来热门的分布式机器学习框架,能够在保护各个本地节点数据安全的同时以较小的通信开销完成整体模型的训练任务。这......
近年来,各种基于人工智能的应用在越来越多的领域中逐步取得比原有方法更好的效果。其中,自动驾驶逐渐成为人工智能领域最重要的落......
随着居民综合能源系统(residential integrated energy system,RIES)中能源类型、设备种类愈加丰富,如何应对多能异质负荷与外部能源......
冰蓄冷空调系统利用夜间多余电能蓄冷,白天蓄冰槽辅助制冷机组供冷,减轻了电网供电压力。和普通空调系统相比,冰蓄冷空调系统初始......
无人驾驶是当今人工智能技术热门应用场景之一,也是众多学者的研究热点。路径规划作为无人驾驶的关键技术之一,对推动智能汽车的快......
随着科技的发展,机器人越来越广泛地应用于各行各业,机械臂作为机器人的一个主要分支也越来越多地出现在科研、医疗、工业等场景中......
随着无人机技术的发展,对无人机空战攻防对抗决策提出了新的要求。本文以深度强化学习为基础,对复杂空战环境下的无人机空战攻防对......
针对传统模型受功率随机波动性影响以及易忽略重要信息从而导致预测精度低的问题,提出两种基于注意力(attention)机制的深度确定性策......
由于传统能源的不可再生性以及人们对能源的需求越来越大,传统能源的枯竭已成为不得不面对的问题。新能源开始不断被人发掘利用,由......
多能互补协同运行是综合能源系统实现运行经济效益最优的重要技术之一。针对引入间歇性可再生能源的电-气综合能源微网运行优化问......
谐振式微波传感器因其测量精度高、检测速度快、成本低、无创等特点,在各种工业传感应用中受到了广泛的关注并迅速发展。本论文致......
旋翼类飞行器一直以来在各个领域都有广泛的研究,这其中就包括旋翼飞行器的自主降落技术,为了实现旋翼飞行器能够精准稳定降落到未......
针对履带式车辆自主行驶控制中滑动参数难以精确估计和在复杂地面条件下难以稳定跟踪目标路径的问题,提出一种考虑履带车辆滑动转......
直线电机具有直驱特性和“零驱动”模式,能够很好的克服传统直线伺服系统在精度和迟滞方面的不足。本文基于三个直线电机模组耦合......
无线驱动通信网络中,无线设备(WD)可以通过无线反向散射和主动射频传输两种方式进行数据卸载.如何合理分配系统中WD的主动传输和反......
汽车纵向自动驾驶的决策层根据车辆当前运动状态与环境信息,决策出理想的动作指令.目前如何在自动驾驶决策策略中考虑人类驾驶员的......
无人地面车辆自主导航系统是智能交通的重要组成部分,对人类社会的发展进步有着重要意义。近年来无人地面车辆自主导航系统相关的......
自动驾驶汽车集环境感知、智能决策和协同控制于一体,能充分协调车辆与交通环境的关系,保证车辆的平稳安全行驶,是汽车未来发展的......
路径规划是人工智能领域的一个重要研究领域,在国防军事、交通运输、机器人导航等诸多领域有着广泛的应用。目前就这一领域的研究......
随着航天、航空以及核能电站等领域的设备集成度不断提高,其内部工作空间越来越狭小,环境越来越复杂,内部作业要求越来越高。而蛇......
针对传统仿生智能算法处理异构光伏发电功率预测精确建模问题时存在的线路多阻抗参数约束下方差波动、线损分析易陷入局部极值等不......
近年来,随着信息技术和互联网技术的快速发展,数据增长速度远远超出了人类对信息的认知处理速度,不可避免地带来信息过载的问题。......
无线频谱资源的短缺及其较低的利用率一直是移动通信技术发展的瓶颈,作为移动通信技术的重要组成部分,LTE(长期演进,Long Term Evo......
为解决深度强化学习训练时间长、收敛慢的问题,该文针对未知环境下的机器人路径规划,基于深度确定性策略梯度(DDPG)算法,结合人工......
针对带有优先经验回放机制的深度强化学习中存在的学习效果容易受到时序误差离群值的不利影响、学习过程忽略立即回报和时间差分误......
飞机规避中距空空导弹的逃逸机动策略对于提高战斗机的生存力至关重要。针对深度确定性策略梯度算法训练智能体学习飞机规避导弹的......
提出了基于和树—深度确定性策略梯度(Sumtree DDPG)的多路口智能交通信号控制算法,通过对交叉路口数据的实时观测,智能地调控交通......
综合能源系统的优化调度对于实现系统的多能互补和经济运行具有重要意义.然而,系统中可再生能源的间歇性以及用户用能需求的不确定......
传统网络因其控制平面与转发平面紧耦合,使得系统的升级成本较大,且网络的运行和维护工作量较大。软件定义网络(Software-Defined ......
将深度强化学习技术应用于投资组合管理,采用深度强化学习中的深度确定性策略梯度DDPG(Deep Deterministic Policy Gradient)算法,......
深度强化学习往往存在采样效率过低的问题,优先级采样可以在一定程度上提高采样效率。将优先级采样用于深度确定性策略梯度算法,并......
多智能体深度确定性策略梯度(multi-agent deep deterministic policy gradient,MADDPG)算法是深度强化学习方法在多智能体系统(mu......
近年来,伴随汽车保有量增长所带来的交通拥堵、道路安全等问题,汽车智能化已经成为整个汽车行业未来发展的重点研究方向。当前智能......
自动驾驶系统是一个集环境感知、决策控制等功能为一体的综合系统,近年来随着人工智能技术的发展及其在生活中的普及,机器学习的方......
针对某型高超声速飞行器,在无气动力作用的情况下,实现基于飞行器尾部的反作用力控制系统(RCS)的姿态控制。首先对飞行器姿态动力......
本文针对固定翼无人机自主着陆控制问题,提出了基于深度强化学习(DRL)的无人机着陆轨迹跟踪控制方法。首先,搭建了小型固定翼无人......
为了进一步提高双延迟深度确定性策略梯度算法(TD3)的网络探索性能和收敛速度,提出一种采用基于多步优先和重抽样优选机制的双经验......
近年来,随着汽车电动化、智能化技术的快速发展,节能与新能源汽车的能量利用效率得到了大幅提升。与此同时,政策与法规对车辆的能......
随着智能交通的发展,智能汽车逐渐成为汽车行业研究的重点,其中驾驶决策是智能汽车有别于传统智能辅助驾驶汽车的关键所在。因此,......
针对传统的协同式自适应巡航控制的算法响应慢、无法快速准确地对突发危险路况做出反应的问题,设计了基于深度强化学习的协同式自......
可再生能源出力的间歇性、柔性负荷波动的随机性与种类的多样性容易造成微电网内部电力供需失配等问题,弃能或者过载对微电网的稳......
深度强化学习是机器学习领域中一个新的研究热点。它以一种通用的形式将深度学习的感知能力与强化学习的决策能力相结合,并通过端......
采用离散动作空间描述速度变化的智能车汇流模型不能满足实际车流汇入场景的应用要求,而深度确定性策略梯度(DDPG)结合策略梯度和......
针对热力站供热量与需求量不匹配的现象,提出一种基于深度确定性策略梯度(DDPG)的热力站一次侧优化控制方法。采用LSTM(long short......