K-MEANS和AIS融合聚类算法的研究

来源 :北京师范大学 | 被引量 : 0次 | 上传用户:whoabc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是指从海量的数据中提取有价值的信息和模式,是信息技术发展的必然产物。数据挖掘的功能包括关联规则挖掘、分类、聚类、预测、偏差分析等,其中聚类分析的目的是将数据集合分组成若干类,使同类之间具有高度相似性,异类间高度相异性。目前,国内外已有很多专家提出了大量的理论和方法,取得了卓越的成果,但是,随着数据需求的不断增长,数据对象的日趋复杂化,要求聚类算法要不断地改进,创新,以丰富聚类技术研究的内容,使之适应新的应用领域。   本文在对传统聚类算法进行总结和分析的基础上,引进了最新的人工免疫理论,提出了传统聚类算法K-MEANS与人工免疫聚类算法AINET的两种结合方式,实验结果表明,这两种算法都在聚类性能上有所改善。主要内容如下:   第一部分简单介绍了数据挖掘聚类算法的发展以及特点。   第二部分对现有的聚类方法进行了总结。   第三部分介绍了人工免疫系统的生物学背景,详细讨论了目前两种比较成功的算法模型RLAIS和AINET。   第四部分详细介绍了K-MEANS聚类算法的原理和研究现状。   第五部分提出了K-MEANS算法与AINET算法的第一种结合方式,对其思想,流程进行了详细讲解,用四组数据进行实验,分析实验结果。   第六部分提出了K-MEANS算法与AINET算法的第二种结合方式,对其思想,流程进行了详细讲解,用四组数据进行实验,用两个指标来衡量聚类算法的性能。   最后对现有工作进行总结和展望。
其他文献
目前垃圾邮件泛滥的情况极为严重。垃圾邮件占用了大量的传输,存储和运算资源,造成邮件服务器拥堵,还被用来传播色情,发布反动言论,骗人钱财,妖言惑众,已经对现实社会安全造成了危害
网格作为一种建立在互联网之上的新一代基础设施,在国内外的学术界和工业界都引起了广泛的关注。目前以网格为基础的分布式应用已经遍布商务、政务和科学活动等各个领域。随着
随着信息化建设工作的推进,现在存在着大量的网络科技资源数据库和应用系统,但是由于管理体制等原因造成数据库和系统结构迥异,各数据库和应用系统彼此孤立,相互之间难以实现资源
随着信息时代的到来,数据集增长和更新更快、数据维度更高、非结构化性更突出。面对大量真实的高维数据,人们渴求通过有效的降维而在低维很好的处理利用,如分类、基于内容检索、
随着计算机的普及和计算机网络的使用,计算机越来越多地服务于人们的生产和生活。计算机的应用对于企业来说是一把双刃剑,一方面,企业利用计算机提高了工作效率:另一方面计算机的
表格结构作为一种简洁有效的数据信息表达方式,在各种领域的Web页中都得到了广泛的应用。但因其形式及功能的多样性,给基于表格结构的Web信息提取带来了巨大的挑战,主要体现
结合系统生命周期分析,计算机安全事件频发的主要因素包括:系统设计阶段对安全问题考虑不充分、开发测试阶段未能避免安全漏洞、部署阶段中缺少强力的主动防御机制,这几个问题
随着多媒体技术、数字电视和网络技术的发展,积累了大量的视频资料,海量多媒体数据资料涉及到数字化存储、编目管理、检索查询和资料发布等问题,这就要求首先把视频序列分解成为
近年来,随着Internet的迅速发展,XML已经成为网络上数据描述和数据交换事实上的标准。网络上信息的本质特性和XML内在的灵活性,使得XML非常适合用来作为网络上数据的载体。因此,
在计算机与网络信息技术飞速发展的今天,各个领域的信息与数据急剧增加,并且由于人类的参与使数据与信息中的不确定性更加显著,信息与数据中的关系更加复杂。如何从大量的、