论文部分内容阅读
随着计算机技术的发展,企业已经进入信息化时代并且积累了大量日常数据,由于数据量的日益增长而出现海量数据贫乏知识的现象。数据挖掘的出现解决了这个问题,数据挖掘可以发现数据中隐含的信息,这些隐含的信息可以辅助企业管理者决策。商业智能是数据挖掘在企业中的具体应用,因此本文研究商业智能。商业智能主要由数据仓库、ETL(Extraction Transformation Loading)、OLAP(On-Line Transaction Processing)、数据挖掘组成。由于在实际应用中各因素对结果的影响程度不同,因此首先采用连环替代法确定各因素的重要程度,然后采用层次分析法对各因素赋以权值,在此权值的基础之上实施数据挖掘算法。使用本文提出的加权算法,通过加权可以减少规则数目,着重挖掘用户感兴趣的规则。构建包含正负关联规则的频繁模式树,实现可以挖掘出正负关联规则的加权频繁模式树算法。加权最小二乘法通过对因变量和自变量进行准确建模实现预测功能,本文提出使用由连环替代法和层次分析法确定加权最小二乘法的权值,实验证明此种确定权值的方法具有很好的拟合度。为了克服朴素贝叶斯的缺陷,本文对加权混合贝叶斯算法进行改进,使用本文的算法进行加权。加权混合贝叶斯算法把属性分为相互独立的属性子集,在属相子集之间使用加权朴素贝叶斯算法,属性集内部使用加权TAN算法。混合贝叶斯分类模型,即克服朴素贝叶斯的缺点又具有良好的准确度。本文针对以上算法进行实验,验证算法的准确性和有效性。实验证明,以上加权算法不仅可以良好的体现权值的影响,还可以有效的进行数据挖掘工作。企业使用ERP软件进行日常工作的管理,ERP系统的数据库中包含大量数据为商业智能提供数据源,本文提出商业智能和ERP集成的体系架构。本文结合现有的ERP软件,对ERP软件进行二次开发,在ERP软件之上构建商业智能。本文通过以下步骤实现商业智能整个流程,采用数据平滑处理、数据标准变化和极差归一化进行数据预处理、实现数据挖掘算法、在ERP软件上实现商业智能模块。本文分别实施上述三个数据挖掘算法,验证商业智能模块可以有效的运行并挖掘出正确结果。