论文部分内容阅读
在完成了“钢厂销售管理系统”开发的基础上,通过对该系统的研究和分析,发现大量销售数据表明了钢铁种群具有一定的相关性。鉴于此,本文通过对操作型数据库的数据进行了数据选择、数据清理等数据预处理工作,并构建了OLAP多维数据集,利用数据挖掘聚类分析的k-means算法,对OLAP多维数据集进行了聚类分析,以销售量为度量值重新划分了钢铁的种类。
本文共分五章:第一章讲述了本文的研究背景及研究的内容。
第二章论述了数据挖掘的理论基础,如数据挖掘的定义,数据挖掘的任务,数据挖掘的功能,数据挖掘的系统组成、数据挖掘的一般过程及数据仓库技术与OLAP技术,主要论述了数据挖掘的k-means算法。
第三章对“钢厂销售管理系统”进行了详细的阐述,分析了系统的组成,模块间的关系,以及数据库的设计。
第四章利用k-means算法按照数据挖掘的一般过程,通过对数据的预处理构建了星型结构的OLAP多维数据集,对OLAP多维数据集进行了数据挖掘,并对结果进行了深入的分析。
第五章对本文的工作进行了总结与展望。