基于ADP的在线学习算法及其在热轧活套中的应用研究

被引量 : 3次 | 上传用户:w_mz2007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文讨论研究了自适应动态规划ADP (Adaptive dynamic programming)这一基于强化学习和动态规划的通用学习控制系统算法。自适应动态规划ADP是一个非常有前途的研究领域,它是自适应控制、认知科学、神经系统科学、心理学等多学科交叉融合的产物,可以实现系统的在线学习和最优控制。在过去的数十年间,ADP理论算法研究发展很快并走出实验室在军事、工业上取得成功应用,显示出其卓越的最优控制性能。但是目前的有关ADP的应用研究都是集中在多变量输入单变量输出(MISO)的梯度下降寻优的控制系统。热轧中厚板带钢生产线是一个多变量的复杂的控制系统,活套控制系统是热轧带钢生产线中一个重要的部分,是实现中厚板带钢热连轧的关键设备。活套控制系统也是集中了电气传动技术、计算机技术、液压伺服控制系统、自动控制技术等技术的综合产物,所以对活套控制技术进行研究,从而提高热轧中厚板带钢的产量和质量指标是很有意义的。活套控制系统主要分为对活套高度的控制和带钢张力的控制两个方面,其控制目的就是想让活套的高度和热轧带钢的张力两者能够维持在相应设定值上。因为它是一个双输入双输出的多变量强耦合系统。常规是将活套高度控制和活套张力控制分别当作两个独立的子系统,将耦合视为扰动进行控制效果不是很理想。而自适应动态规划(ADP)是一种更为通用且具有在线学习的控制算法,解决此类问题有着巨大的潜力。本文在对自适应动态规划(ADP)研究的基础上,主要工作如下:(1)论文在经典执行器-评价器结构的ADHDP算法基础上对ANN网络及其权值更新算法做了改进,将其从仅适用MISO系统对象推广到适用于MIMO系统,这是一种更为通用、更实用的在线学习控制模型(GMIMO);(2)对热轧中厚板带钢控制系统中的关键设备液压活套的控制模型进行研究并建立液压活套控制数学模型和仿真模型;(3)将改进型的MIMO ADHDP算法成功应用于活套的高度和张力多变量控制,并用MATLAB仿真软件进行仿真。ADP在线学习算法有效的克服动态规划的“维数灾难”问题,和实际物理模型的“模型灾难”问题。针对活套控制的多变量输入多变量输出系统,并且活套的高度控制和张力控制存在强耦合,建立控制系统模型困难这一现状,建立液压活套控制模型。我们把ADP在线学习控制模型应用到活套控制方面,经过MATLAB软件的仿真,证明效果良好,达到预期的目标,展现出该算法很强的在线学习能力。
其他文献
我国属于水资源严重短缺的国家之一,水资源短缺问题已经成为制约我国经济社会发展的严重障碍。为了应对水资源紧缺日益严重的形势,我们必须加大对于水权有关理论问题的研究,
大型公共建筑空调系统能耗在建筑能耗中占有很大的比重,国内对于此类空调系统的节能运行策略还处于尝试阶段。系统优化节能运行是一个系统中多部件优化节能运行协调的过程,整
目的:狂犬病(rabies)是由狂犬病病毒(rabies virus)所致的以中枢神经系统感染为特征的急性人畜共患烈性传染病。是迄今为止人类病死率最高的急性传染病,一旦发病病死率几乎为
分子印迹技术是一种新兴的分离技术,通常可以被描述成制造识别“分子钥匙”的人工“锁”的技术。它可以制备出对所选目标分子具有高度亲和性及选择性的聚合物材料。近年来分
侧柏叶,为柏科植物侧柏(Platycladus orientalis(L.)Franco)的干燥枝梢及叶,始载于《神农本草经》并列为木部上品,其味苦,入肺、肝、脾经,主吐血衄血痢血,崩中赤白,轻身益气,令人
古代汉语断代同义词的研究,可以通过先秦时期反映当时语言状况的15部典型语料作为研究对象,然后选取十六组同义词进行辨析对比。对于词语“门、户”、“犬、狗”、“声、音”
在过去的岁月里,我们虽然富有无穷的传统文化知识,但这只能说明过去,却不能满足新时代的需求。为了适应新的时代、新的形势我们必须在继承和发扬传统文化的同时,也要不断引进
如果要追究人类语言差异的因由,就一定要提到一个所谓“巴别塔”的历史事件(参创11:1—9)。这事件所要启示和教导的不只“神阻挡骄傲”的真理,事实上,“巴别塔的危机”也是现代人的
期刊
扶贫开发工作,一直是中国政府的重中之重,改革开放以来,我国先后在扶贫领域实施了一系列的政策和措施。而我国的贫困主要是农民的贫困,解决了农民的脱贫问题,也就解决了我国
现代知识日新月异,信息量激增,要想获得更多的有效信息,如果一个人仍然采取传统的、不科学的、低效率的学习,就会导致不能掌握大量的新信息,不能跟上时代发展的脚步。就学生