基于深度强化学习的立体投送策略优化方法研究

来源 :系统仿真学报 | 被引量 : 0次 | 上传用户:hyflover
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于深度强化学习算法在策略优化问题中的良好表现,以立体投送作战行动为主要研究对象,提出了一种深度强化学习框架与仿真推演实验协同的作战行动策略优化方法。在分析策略优化研究现状的基础上,根据研究问题对深度学习框架进行了分析比较,构建了基于A3C算法的深度强化学习立体投送策略模型,并通过仿真推演和分布式计算,实现深度强化学习模型与“人不在回路”仿真推演的交互学习,获得优化后的立体投送策略,验证了深度强化学习框架与仿真推演实验协同优化策略的有效性。
其他文献
“双减”政策为促使学生作业尽快走出学科箱格化、育分低质化等误区创设了有利条件。案例学校在“小学生综合创生式幸福作业”研究基础上,以机制创新为新的生长点与发力点,基于“供给侧—需求侧”协同治理视角,推动作业管理向治理升级,面向家、校、社全场域,通过组织、内容、评价等维度的革新,形成“多力驱动,多环交融,多学赋能”的作业管理模式,创生作业共治共育新样态。
近年来,葡萄酒体验旅游蓬勃发展,葡萄酒旅游作为一种发展空间极大的新型旅游方式和概念产品,其核心在于体验。本文基于消费者调研数据,运用SPSS24.0软件,采用描述性统计分析和有序Logistic回归分析等方法,分析消费者对葡萄酒旅游体验的满意度及影响因素。研究表明,性别、建筑景观、基础设施、参观地点、特色节目、电子服务、环境清新、亲身体验是影响消费者满意度的重要因素,消费者的预期比较、重游意愿、推
报纸
初中语文作业设计是培育学生语文核心素养的重要路径,是提升教师教科研水平和目标站位的常态化教学手段。尤其是在当前教育形势下,核心素养观念深入人心,"双减"政策的落地给教育注入了新的生机,亦给教研带来了新的课题,大单元教学观念、教学实践蔚然成荫。契合于新形势、新理念、新实践下的作业设计迫在眉睫。本文就着眼于探寻契合于大单元教学观念的有效策略,把握好语文作业的"质"与"量",保证课堂教学与作业设计的一致
期刊
为促进我军士官职业良性发展,实现岗位任职能力和职业素养的有效提升,总结美国《陆军士官职业发展指南》“一个中心战略、三维发展领域、三个培养支柱、四个核心素养、四步晋升制度”的职业发展体系并分析其特点,从完善职业发展制度体系、实施开放多样教育培训、提高岗位综合职业能力3个方面提出对我军的启示。
<正>患者女,22岁。发现左颈部肿物1年余,伴间断疼痛。体格检查:左侧锁骨上窝可触及肿块,边界较清,大小约4.0cm×3.0 cm,质地偏硬,活动度稍差。实验室检查:糖类抗原199 41.77 U/ml。胸部CT表现:左侧前纵隔可见巨大团状软组织影,沿纵隔纵向生长,向上达T1椎体水平,向下达肺动脉分叉水平,最大横截面9.9 cm×6.6 cm。肿块占位效应明显,