基于内部回归神经网络的强化学习

来源 :控制工程 | 被引量 : 0次 | 上传用户：wenxiaoyao1214

【摘要】

：

在强化学习和动态规划算法的基础上,提出一种不需要预测模型的改进的强化学习算法.该学习算法在模型未知和没有先验经验的条件下,能通过自身神经网络的在线学习,有效控制不稳

【作者】

：

王瑞霞孙亮阮晓刚

【机构】

：

北京工业大学

【出处】

：

控制工程

【发表日期】

：

2005年2期

【关键词】

：

强化学习内部回归神经网络倒立摆动态规划算法 reinforcement learning internally recurrent net invert

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在强化学习和动态规划算法的基础上,提出一种不需要预测模型的改进的强化学习算法.该学习算法在模型未知和没有先验经验的条件下,能通过自身神经网络的在线学习,有效控制不稳定的非线性系统.该学习算法的网络结构采用内部回归神经网络,这样可以增强网络本身处理动态信息的能力,使其更适合复杂系统的稳定控制.应用到一级倒立摆物理实体的控制,实验结果表明了该学习算法在性能上优于其他同类强化学习算法.

其他文献

黄土丘陵半干旱区人工林迹地土壤水分恢复研究

为了研究黄土丘陵半干旱区人工林迹地土壤水分恢复情况,该文以正在生长的人工林土壤水分含量为人工林迹地土壤水分恢复的起点,并分别以持续农地和持续放牧荒坡的土壤含水量为林后农地和草地土壤水分恢复的上限,对位于黄土丘陵半干旱区绥德县境内的人工林迹地土壤水分恢复情况进行了研究。结果表明,人工林死后的放牧荒坡在20a的时间里,其土壤水分没有补偿;人工林死后的保护草地土壤水分有微弱恢复迹象,但年恢复速度在0.5

期刊

人工林人工林迹地土壤水分土壤水分恢复artificial forest artificial forest slash soil water con

督导主治医师查房提高中青年教师临床教学能力

主治医师常规日查房是临床教学的主要手段之一，将主治医师日查房作为提高其临床教学能力的切入点，成立专家督导组从复核检查病史体征、分析疾病的条理及逻辑思维能力、理论对实

期刊

督导临床教学主治医师查房

基于DSP的冷连轧实时仿真

针对冷连轧轧制过程这个高度复杂的动态过程,提出了一种新的仿真的方法用来实现实时仿真.它利用数字信号处理器DSP的高速运算速度来实现动态模型的实时计算,通过内存映像网与

期刊

实时仿真冷连轧数字信号处理器DSP动态过程轧制过程实时计算动态模型运算速度内存映像冷轧过程行数据控制器交换DSPtandem col

邹城市矿粮复合区土地利用变化及生态系统服务价值分析

以山东省邹城市为试点，依据1990~2005年土地统计资料对该市矿粮复合区生态系统服务价值进行分析。结果表明，矿粮复合区内土地利用结构变化较快，具体表现为耕地的快速减少，水域和

期刊

矿粮复合区农业生态系统服务价值overlapped areas of crop and mineral production（OACM） agro-ec

张家界市柑桔生产的优势及发展对策

介绍了张家界市柑桔生产的历史与现状,分析了张家界市发展柑桔生产的有利条件,指出了张家界市柑桔生产存在的主要问题,提出了张家界市发展柑桔生产的对策.

期刊

柑桔发展对策张家界市

重组质粒电穿孔转染条件探讨

目的：为优化电穿孔转染质粒的条件，提高转染率。方法：以不同条件用电穿孔方法将重组质粒ＰＬＸＳＮ－Ｓ转入ｐ８１５、ｐＡ３１７、ＨｅｐＧ２、ＥＬ４等真核细胞，探讨电压，电容及电转缓冲液温度对转染率的影响。结果（１）低电压（２００～３００Ｖ），高电容（９００～１０００ｕＦ）能

期刊

电穿孔基因转染真核细胞重组质粒Electroporation Gene transfection Eukaryotic cell

多普勒超声心动图法测定肺动脉收缩压在预测心腔内右向左分流的价值

对７７例单纯室缺（ＶＳＤｎ＝３７）和房缺（ＡＳＤｎ＝４０）病人，采用彩色多产勒超声心动图结合超声声学造影法进行检查，旨在通过定量分析肺动脉收缩压（ＰＡＳＰ），观察其对心腔内右向左分流的影响，结果显示：ＶＳＤ、ＰＡＳＰ压力大于４８ｍｍＨｇ可导致右向

期刊

超声心动图VSDASDPASP先天性心脏病

高产优质甘蓝型油菜新品种湘油17号的选育

湘油17号是湖南省作物研究所以早熟品系91-1为母本、224-2为父本进行杂交,以其杂种一代为母本,双低品系7077为父本,经多代复交、选择,于1997年定型、2003年通过审定的高产、

期刊

甘蓝型油菜湘油17号品种选育

硫肥对大蒜的肥效研究

对大蒜进行了施硫试验,结果表明,大蒜施用硫肥能显著提高产量、品质与经济效益.不同的施硫水平对大蒜产量、品质和经济效益的影响程度各异,低施硫量处理对大蒜的肥效要低于高

期刊

硫肥大蒜产量品质sulfur fertilizer garlic field quality

人精液的冻贮研究

目的研究在Ｔ－Ｇ型冷冻保护剂（Ｃｒｙｏｐｒｅｓｅｒｖａｔｉｖｅｍｅｄｉｕｍ，ＣＰＭ）作用下，速缓冻贮法对人精子结构和功能的影响。方法随机双盲对照，将４５份正常精液随机分组，加与不加ＣＰＭ，以速缓冷冻法分别进行冻贮，冻贮前后分别进行常规分

期刊

冷冻保护剂精液冻贮精子染色体CPM：Cryopreservative medium(CPM)；Semen freezing-storing；Sperma

基于内部回归神经网络的强化学习

其他学术论文