论文部分内容阅读
热轧生产线在长期的生产过程中积累了丰富详实的生产实际数据,能否利用这些数据来分析产品质量,是工程技术人员、产品质量管理人员一直想解决的问题。本文在讨论数据挖掘的相关技术及其分类的基础上,详细讨论了数据挖掘技术与联机分析处理、统计学和知识发现之间的区别联系,得到数据挖掘就是从企业大量的数据中找出新颖的、有效的、具有潜在效用的、最终可以理解的规律或模式,来指导企业管理和控制产品质量,为企业创造巨大的财富。本文同样对数据挖掘工具SPSS和Clementine的关键技术及其相关特点,也进行了深入的剖析,并以某钢厂的热轧带钢生产线为实例,采用数据挖掘技术,对热轧过程中产生的大量数据进行分析、处理,从而得到有用的信息。本文主要做了以下几个方面的的工作:
⑴根据热轧产品的质量控制,将数据挖掘方案具体化。设计来自热轧生产线上的大量数据的数据集市。
⑵利用SPSS软件进行数据分析,将原本影响热轧带钢产品质量的210个变量通过数据整理、数据降维、数据采样各个步骤的处理分析,进而得到影响热轧产品质量的52个关键变量。
⑶通过52个关键变量分别建立神经网络和线性回归两种建模方式,进行分析比较。根据建模效果,最终选择了神经网络建模。通过Clemtine软件中神经网络模型中的快速建模方法,将大量的生产数据放入模型中,作为建模样本和检验样本,最终得到模型的准确度为95.988%,符合工程实际要求。
⑷利用已建立的神经网络模型进行相关分析,提出用相关性对产品质量模型进行校检分析的方法。利用相关分析的结果,通过调节与输出变量相关性显著的关键输入变量精度,进而将输出变量钢板厚度控制在希望的范围内。
⑸对不同的规格的产品进行比对分析验证,进一步验证了和钢板厚度有密切相关性的关键输入变量,并验证了利用神经网络和相关分析进行热轧产品质量模型的控制是可行的。