论文部分内容阅读
随着工业“4.0”和“制造强国”概念的提出以及云存储技术的迅速发展,制造行业的产品数据日益完善。电机制造业迫切需要从大量数据中探索产品提质增益的途径。传统的质量分析方法从电气设计、机械构造和制造装配过程出发,定性描述和分析质量影响因子。这些方法已不能满足新时代对制造业提出的高要求、高标准。本文从数据挖掘与知识发现角度出发,旨在从海量检测数据中挖掘潜在的质量知识规律。关联规则挖掘则是数据挖掘的研究热点之一,主要研究数据项集间的关联关系。经典Apriori算法虽能有效遴选出频繁集,但重复读取数据,运算效率极低;FP-Tree、FUP等改进算法耗费内存空间,不断访问磁盘,效率仍然较低;基于贝叶斯估计的方法效率虽高,但精确度较差。本文围绕以上问题展开相关研究,研究一种基于刀切贝叶斯估计的关联分析方法,采用刀切贝叶斯估计方法和极大似然函数,计算项变量的最佳概率分布函数,筛选出符合条件的1_项频繁集,再结合Apriori算法核心思想,产生定量化的关联规则。针对实际应用中产品数据不断增量更新的场景,研究增量更新算法,结合共轭先验分布理论,将初始样本分布视作先验分布,新增数据视作样本信息,继而实时更新项变量分布参数,高效生成定量关联规则。最后,通过模拟仿真充分验证了本文方法的有效性和优越性,并将其应用于电机质量大数据管控系统进行批量检测数据的关联分析,找到了电机生产指标、装配指标和电气指标之间的关系。