论文部分内容阅读
本论文基于自适应动态规划(Adaptive Dynamic Programming, ADP)方法,结合反演控制法,鲁棒控制理论,自适应控制理论,对各种约束条件下的导引控制一体化(Integrated Guidance and Control,IGC)的设计进行研究,综合考虑导弹制导控制性能的稳定性与最优性。首先,建立俯仰平面内的导引控制一体化模型,然后基于此模型,主要从三个方面深入研究与分析相应的导引控制一体化设计方法:讨论全状态受限条件下的一体化设计问题,讨论在干扰作用下的输入受限的一体化设计问题和预定性能(时变界值)(Prescribed Performance Control,PPC)下的一体化设计问题。本文的主要内容有:
(1)针对导引控制一体化设计中状态受限问题,提出了一种结合反演控制与自适应动态规划(ADP)技术的新型一体化设计方案。首先,将状态受约束的严格反馈系统通过坐标变换转化为状态不受约束的系统。然后,采用前馈反演控制与反馈最优控制相结合的设计思路,前馈反演控制保证跟踪误差的收敛性,反馈控制保证系统的稳定性与性能最优性。在反馈控制环节,提出了一种新型的性能指标,同时确保系统的状态最优,误差最小与能耗最低。构建单神经网络代替传统的双神经网络逼近性能函数,减少计算负担,并利用ADP技术在线求解非线性HJB方程得到最优解,最后通过李雅普诺夫理论证明了系统的闭环稳定性与所有信号的一致有界性。与传统方法的对比仿真验证了该设计方法的可行性与优越性。
(2)针对未知干扰作用下输入受限的导引控制一体化设计问题,提出了基于微分对策的鲁棒ADP一体化设计方案。先考虑不含干扰项的标称系统,选取了合适的非二次型泛函作为性能指标解决了输入受限引起的饱和非线性问题,由HJI方程及Bellman最优原理得到博弈双方的最优控制律,然后在考虑干扰的情况下重新选取性能指标,利用鲁棒增益量ε对先前得到的最优控制律进行调整,确保控制律满足鲁棒性与最优性。利用ADP技术在线求解非线性HJI方程,使用梯度下降法实现权值更新,仿真结果验真了该设计方法的可行性与鲁棒性。
(3)针对导引控制一体化设计中预定性能控制问题,提供了两种不同的设计方案,基于误差坐标转换的设计方法与基于时变障碍李雅普诺夫函数的设计方法。通过反演控制设计前馈控制器,并将原系统转化为误差信号系统,对误差信号系统进行反馈最优控制器的设计。利用ADP技术在线求解非线性HJB方程。对于误差坐标转换的方法,由于将时变信号引入转换后的误差系统,需要求解非线性时变HJB方程。为了解决这一问题,本文使用时变的激励函数与定常的权值相结合逼近时变代价函数,对比于常规的定常激励函数起到了良好的神经网络训练效果。对于时变障碍李雅普诺夫函数的设计方法,本文提出了一种新型时变障碍李雅普诺夫函数,能够确保该设计方法在系统不受预定性能的要求时继续适用。最后,对两种设计方法的设计过程与适用范围进行比较。
(1)针对导引控制一体化设计中状态受限问题,提出了一种结合反演控制与自适应动态规划(ADP)技术的新型一体化设计方案。首先,将状态受约束的严格反馈系统通过坐标变换转化为状态不受约束的系统。然后,采用前馈反演控制与反馈最优控制相结合的设计思路,前馈反演控制保证跟踪误差的收敛性,反馈控制保证系统的稳定性与性能最优性。在反馈控制环节,提出了一种新型的性能指标,同时确保系统的状态最优,误差最小与能耗最低。构建单神经网络代替传统的双神经网络逼近性能函数,减少计算负担,并利用ADP技术在线求解非线性HJB方程得到最优解,最后通过李雅普诺夫理论证明了系统的闭环稳定性与所有信号的一致有界性。与传统方法的对比仿真验证了该设计方法的可行性与优越性。
(2)针对未知干扰作用下输入受限的导引控制一体化设计问题,提出了基于微分对策的鲁棒ADP一体化设计方案。先考虑不含干扰项的标称系统,选取了合适的非二次型泛函作为性能指标解决了输入受限引起的饱和非线性问题,由HJI方程及Bellman最优原理得到博弈双方的最优控制律,然后在考虑干扰的情况下重新选取性能指标,利用鲁棒增益量ε对先前得到的最优控制律进行调整,确保控制律满足鲁棒性与最优性。利用ADP技术在线求解非线性HJI方程,使用梯度下降法实现权值更新,仿真结果验真了该设计方法的可行性与鲁棒性。
(3)针对导引控制一体化设计中预定性能控制问题,提供了两种不同的设计方案,基于误差坐标转换的设计方法与基于时变障碍李雅普诺夫函数的设计方法。通过反演控制设计前馈控制器,并将原系统转化为误差信号系统,对误差信号系统进行反馈最优控制器的设计。利用ADP技术在线求解非线性HJB方程。对于误差坐标转换的方法,由于将时变信号引入转换后的误差系统,需要求解非线性时变HJB方程。为了解决这一问题,本文使用时变的激励函数与定常的权值相结合逼近时变代价函数,对比于常规的定常激励函数起到了良好的神经网络训练效果。对于时变障碍李雅普诺夫函数的设计方法,本文提出了一种新型时变障碍李雅普诺夫函数,能够确保该设计方法在系统不受预定性能的要求时继续适用。最后,对两种设计方法的设计过程与适用范围进行比较。