【摘 要】
:
针对目前工程上通过在弹道上选取特征点,利用系数冻结法去研究和设计,这样一系列的假设会使设计的导弹模型与实际的弹体模型存在一定的差异,因此,提出了基于强化学习的过载自
【机 构】
:
南京理工大学自动化学院,南京210094
论文部分内容阅读
针对目前工程上通过在弹道上选取特征点,利用系数冻结法去研究和设计,这样一系列的假设会使设计的导弹模型与实际的弹体模型存在一定的差异,因此,提出了基于强化学习的过载自动驾驶仪在线调整PID参数,研究飞行器的控制问题,该方法将导弹作为智能体,读取飞行状态信息并建立动作策略和奖惩机制;其次,智能体根据算法给出的随机动作指令执行,执行完动作之后反馈状态信息,算法根据反馈的状态信息给出新动作.最终,通过多回合训练实现了过载指令的跟踪,证明了该方法的有效性.
其他文献
为了验证中国实验快堆(CEFR)堆芯燃料组件的抗震性能,保证地震下结构完整性和气密性,必须研究制定兼具代表性和包络性的堆芯组件抗震试验方法.本文基于俄罗斯组件耐振试验方
1 目标和概述rn互联网应用场景向“大带宽、低时延、大存储、高算力”不断延展,部分算力需求由云端迁移到边缘.当前,边缘计算产业已完成初期市场培育,但电信运营商与CDN服务
研究中部区域收入差距具有较为典型的意义。本文通过对1994-2009年湖南省内不同区域间城乡居民收入差距进行MLD指数的(动态)测度与分析,发现在测量期间内湖南省区域收入分配差异总体呈持续扩大趋势,湘东、湘中、湘西区域间收入差异是影响全省收入差异的主要因素。缩小区域经济发展差异、均衡地区间支付转移水平是解决收入差距日异扩大的关键。
人员可靠性分析(HRA)作为核电厂概率安全评价(PSA)中的重要组成要素,一直是影响PSA分析质量和风险见解的关键内容.目前业界中已有的HRA方法众多,不同的HRA方法各有优缺点且存
钚是与核工业密切相关的敏感元素,是来源于人类核活动、以痕量或超痕量水平存在于环境中的重要锕系元素.与陆地土壤中钚的环境行为不同,输入到海洋环境中的钚会随洋流路径进
氟盐冷却高温堆(FHR)采用氟盐冷却球形燃料元件,其中子物理计算面临双重不均匀性问题:燃料球在堆芯内的随机排布和包覆燃料颗粒在燃料球中的随机排布.此问题是该堆型设计中面
1 目标与概述rn当前,企业需实现生产设备更智能以及生产管理更智能,打造更柔性的生产线,并将分布广泛的人、机器和设备连接起来,构建统一的工业互联网络.同时,在新的网络架构
中国原子能科学研究院目前正在研制用于硼中子俘获治疗(BNCT)的强流质子回旋加速器,该加速器设计引出能量14 MeV、质子束流强大于1 mA.相比引出流强为400μA的PET回旋加速器,
1 目标和概述rn目前传统零售行业存在较大的同质性,竞争比较激烈.头部零售企业开始通过大数据分析对日常经营进行指导,以提高坪效并提升运营效率、降低成本.rn在此过程中,传
1 目标和概述rn1.1 概述rn工业制造企业面临实时生产数据得不到反馈,企业无法做出决策;产品生命周期环节管理不到位,不能预测维护等;生产资源配置不够优化,协同管理未发挥真