论文部分内容阅读
目前自动化和数据库技术已经渗透到广泛的工业生产过程中,在这些过程的实时数据库中积累了大量的系统运行数据,其中蕴含了许多与工业过程控制、参数优化、产品质量以及生产管理有关的信息,它们为数据挖掘技术在复杂工业过程领域的应用提供了广阔的平台。 本论文以复杂工业生产过程为研究背景,以分类关联规则挖掘算法为研究主线,对数据挖掘流程中几个重要阶段所包含的具体技术和内容(数据预处理技术、探索性分析方法、数据挖掘建模及实施应用)分别进行了研究。同时结合实际工程项目(某冶炼企业铅烧结烟气WSA制酸过程关联规则挖掘),进行了具体的实施和应用。 本论文的主要研究工作概括如下, 在数据预处理阶段,提出了一种多变量监督型离散化(MSD)算法 针对工业过程数据的特点(变量多、耦合强、数据处理量大),本论文提出一种多变量监督型离散化算法。该算法分两层实现:首先利用聚类算法进行粗离散化(在该离散化过程中充分考虑了数据集中多个条件变量间的相关信息);然后运用Chi2离散化算法进行细离散化(该离散化过程中充分吸取了数据集中的分类信息)。该离散化算法充分利用数据集的分布特征和分类信息,实现了对数据集的自动离散化。对比测试分析和实践应用均证明该算法具有良好的离散化效果。 在建模阶段,提出了三种数据挖掘模型 (1)提出了一种模糊分类关联规则挖掘(FCARM)模型 在现有分类关联规则挖掘算法的基础上,本论文提出一种模糊分类关联规则挖掘模型。该模型有如下贡献:第一,引入一种新的基于距离的支持度定义;第二,将多变量监督型离散化算法引入到连续属性的离散化过程中,增强了模型的离散化效果。第三,进一步将模糊集概念引入模型中,克服了属性划分过程带来的边界过硬的缺点。最后运用此模型对芳烃抽提工业过程的历史数据进行了挖掘。 (2)提出了一种基于模糊分类关联规则集(fuzzyCARs)的模糊系统构建方法 在传统的模糊系统建模过程中,存在两个较难克服的困难:其一是数据对象