论文部分内容阅读
现代工业过程机理十分复杂,使得很难对生产过程以及运行指标与被控变量之间的关系精确建模。而传统工业过程多使用人工经验以开环的形式来调节设定值,且人工操作不具备较高的准确定性和随动性,因此经济效益较差甚至会导致故障工况的出现。在这种情况下,如何基于工业运行过程数据信息,不依赖模型参数给出设定值设计方案,优化运行指标是一挑战性难题。鉴于实际工业过程往往在稳态点附近运行,系统在稳态点成线性特征,本文用线性系统刻画被控过程,考虑运行控制层和底层控制层不同的时间尺度,提出两种学习算法:一种是基于Q-学习方法的次优设定值学习算法,另一种是基于状态观测器的Q-学习算法。这两种算法完全利用数据,学习得到设定值,实现运行指标以近似最优的方式跟踪理想值。最后通过浮选过程仿真实验验证本文所提方法的有效性。本文主要工作与贡献如下:1.对双层运行反馈控制问题进行描述,针对运行层和底层控制层不同时间尺度的问题进行建模、设计运行优化控制器,使得运行指标跟踪理想值。2.不同于基于模型的运行优化控制方法,引入状态观测器来估计工业过程的未测量状态,提出一种系统状态可测情况下实现系统最优运行的Q-学习算法和一种基于状态观测器的Q-学习算法,不依赖于被控过程模型参数和运行指标动态参数,完全基于数据学习次优设定值,避免模型参数不精确,甚至未知给运行优化控制问题研究带来的消极影响。3.以浮选过程为仿真示例,在Matlab环境下进行仿真实验,并与传统运行控制方法进行比较,验证本文提出的算法的有效性。