论文部分内容阅读
在国民经济和人民生活中,复杂工业过程所在的行业占有重要地位。复杂工业过程中的一些需要控制的过程变量,在现有技术条件下不易直接测量或者难以快速在线测量,只能通过控制其他可测变量,间接地保证质量要求。软测量技术很好地处理了这类问题。工业软测量是一种基于工业过程数据的建模技术,数据的有效性直接影响到模型的精度。然而,在复杂工业过程中,由于测量者在实际测量时读取或者记录数据的失误,亦或因为检测的仪器受到了随机干扰,这些都会使数据出现异常,称这类数据为异常点。判断建模数据是否是异常点,并且将它剔除,对于复杂工业过程软测量建模来说是很重要的。在此背景下,本文在深入研究了复杂工业过程建模数据特点的基础上,提出了将聚类算法与软测量建模相结合的新方法。针对复杂工业过程中因素法建模数据异常点检测的特殊性,本文提出了一种与软测量建模结合的基于K-means算法的改进DBSCAN聚类方法。首先,该方法用K-means算法对DBSCAN算法改进,弥补了传统DBSCAN算法对非均匀密度数据聚类效果不佳的缺陷。再次,该方法将异常点检测与软测量建模相结合,用建模误差对异常点检测过程进行指导,这样既保证了异常点检测的质量,同时建立了精确的软测量模型。将该方法用于宝钢集团300吨LF炉钢水温度软测量建模数据上,实验结果表明效果良好。针对复杂工业过程中时间序列建模数据异常点检测的特殊性,本文提出了一种异常点检测的新方法。该方法首先把原数据集分段处理,随后用DBSCAN算法对每段数据进行异常点检测,然后将剔除异常点后的数据集整合和填补,再将新数据集的建模误差返回算法中指导DBSCAN算法参数的选择。新方法将建模误差作为异常点检测过程的指导,既避免了传统聚类过程中人工干预的不足,还保证了异常点检测的质量,同时建立了精确度较高的软测量模型。使用此方法对上海宝钢集团电力负荷建模数据进行异常点检测,仿真实验表明,新方法能在保证建模精度的同时成功检测出异常点。