论文部分内容阅读
数据挖掘是指从海量的数据中提取有价值的信息和模式,是信息技术发展的必然产物。数据挖掘的功能包括关联规则挖掘、分类、聚类、预测、偏差分析等,其中聚类分析的目的是将数据集合分组成若干类,使同类之间具有高度相似性,异类间高度相异性。目前,国内外已有很多专家提出了大量的理论和方法,取得了卓越的成果,但是,随着数据需求的不断增长,数据对象的日趋复杂化,要求聚类算法要不断地改进,创新,以丰富聚类技术研究的内容,使之适应新的应用领域。
本文在对传统聚类算法进行总结和分析的基础上,引进了最新的人工免疫理论,提出了传统聚类算法K-MEANS与人工免疫聚类算法AINET的两种结合方式,实验结果表明,这两种算法都在聚类性能上有所改善。主要内容如下:
第一部分简单介绍了数据挖掘聚类算法的发展以及特点。
第二部分对现有的聚类方法进行了总结。
第三部分介绍了人工免疫系统的生物学背景,详细讨论了目前两种比较成功的算法模型RLAIS和AINET。
第四部分详细介绍了K-MEANS聚类算法的原理和研究现状。
第五部分提出了K-MEANS算法与AINET算法的第一种结合方式,对其思想,流程进行了详细讲解,用四组数据进行实验,分析实验结果。
第六部分提出了K-MEANS算法与AINET算法的第二种结合方式,对其思想,流程进行了详细讲解,用四组数据进行实验,用两个指标来衡量聚类算法的性能。
最后对现有工作进行总结和展望。