论文部分内容阅读
工业系统的过程监测在维持设备安全运行,提升生产效率以及产品质量等方面起到了巨大作用。随着集散控制系统和智能仪表的普及,大量传感器数据被记录下来,基于数据驱动的故障检测与识别方法能够从大量历史数据中挖掘出表征过程状态的隐含特征,在实际过程中有着广泛的应用。张量作为多维数组的直观表达方式,在记录数值信息的同时也能保留数据间的结构联系。本文结合系统的拓扑结构以及动态特性,构建张量形式的过程数据,存储更多的工业过程信息。然而在面对张量型数据时,通常需要将其展开成向量形式才能适用于各类学习算法,为减少结构信息的丢失,本文引入多线性主成分分析(MPCA)和支持高阶张量机(SHTM)等方法,建立了张量空间的故障检测与识别模型。本文具体研究内容如下:(1)从几何与代数的层面上介绍了张量的概念及相关运算,然后根据工业系统的某些结构、时序等特点,建立恰当的高阶张量形式的数据表达方式。(2)张量距离(TD)可以合理地度量高阶数据之间的距离关系,为了实现工业过程中张量样本的故障检测,减少训练时间,提出了基于张量距离的故障检测模型,在输入空间通过衡量样本与数据中心点间距的方式,进行过程数据的快速检测。(3)为减少人工参与,提高故障检测的效率,利用多线性主成分分析(MPCA)算法在高维空间中提取数据的主要特征,避免对原始张量高阶结构和内在相关性的破坏,提出了基于MPCA的故障检测模型,并设计了R和E两个监控统计量以及对应控制限的求解方法,用于故障的检测。(4)在针对一阶张量的PCA-SVM故障识别模型的基础上,提出了适用于任意阶张量的MPCA-SHTM识别模型,无需将数据展开成向量形式,直接学习张量样本的数值记录与结构特征,降低了维数灾难和过拟合的风险,实现工业系统故障的分类与识别。