聚类算法的研究及应用——基于群智能技术的聚类算法研究

来源 :江南大学 | 被引量 : 0次 | 上传用户:yhljlb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是在海量的数据中寻找模式或规则的过程。数据聚类则是数据挖掘中的一项重要技术,是人们认识和探索事物之间内在联系的有效手段,它既可以作为独立的数据挖掘工具,从知识库中获取数据分布的一些深入信息,也可以作为其它数据挖掘算法的预处理步骤,且广泛应用于商务管理、市场分析、工程设计和科学探索等领域。聚类就是将数据对象划分到不同的类或者簇中,使得属于同簇的数据对象相似性尽量小,而不同簇的数据对象相异性尽量大。   蚁群算法和粒子群优化算法是群智能理论研究领域的两种主要算法。蚁群算法源于蚂蚁堆积他们的尸体和分类它们的幼体的研究,粒子群算法源于鸟群群体运动行为的研究。作为新兴的演化计算技术,群智能算法已成为越来越多研究者的关注焦点,并被引进到数据聚类领域里且发挥了巨大的作用。但由于蚁群算法和粒子群算法还不够完善,在数据聚类的处理过程中存在智能算法自身的缺陷,导致聚类效果的差强人意,因而如何设计出行之有效的聚类算法将成为群智能理论在聚类领域发展的一个重要课题。   针对基本蚁群聚类算法较长时间开销和易产生冗余聚类数目的缺陷,提出了一种聚类邻域自适应调整的多载蚁群算法。算法通过邻域动态自适应调整寻找纯净的邻域,增强蚂蚁记忆体记忆纯净邻域的大小,蚂蚁之间协同交流进行多载整合相似邻域形成最终聚类结果。实验结果表明新算法能有效提高算法效率且取得较好的聚类效果。   针对K-调和均值和混沌粒子群聚类算法的优缺点,本文提出了一种融合K-调和均值的混沌粒子群聚类算法。首先通过K-调和均值方法把粒子群分成若干个子群体,每个粒子根据其个体极值和所在子种群的全局极值来更新位置。其次,算法中引入变尺度混沌变异,抑制了早熟收敛,提高了计算精度。实验证明,该算法可以有效避免算法陷入局部最优,在保证收敛速度的同时增强了算法全局搜索能力,明显改善了聚类效果。  
其他文献
形式文法是分析知识文档结构并从中抽取知识重要手段,然而,人工总结自然语言处理所需的文法是十分困难的。人们容易想到的方法是从语料中学习文法,但是面向自然语言的文法学
随着软件技术的演进和信息社会的发展,人们对软件需求呈现出多样化、易变性以及综合化的发展趋势。特别是在包含大量异构数据的智能交通信息系统中,包括较多的独立功能模块,
随着物联网相关技术的不断进步,物联网已广泛应用于各个领域,推动社会生产方式、生活方式、人与物的关系发生重大变革。在目前的物联网环境下,数以亿计的传感器设备在工作着,无时
当前支持GPU和GPU集群的编程技术十分落后和低层,程序员广泛使用的并行编程模型MPI、Pthread和CUDA等,被认为是并行编程中的汇编语言。在当前的技术条件下,无论进行单机GPU程
命名实体间语义关系抽取是文本信息抽取中的关键步骤,是语义识别的重要研究方向。随着互联网对人们生活、学习、工作等各个方面的不断加深的影响,从自由文本及互联网网页中抽
根据掌纹线具有多方向性的特点,将多个方向的特征值组成一个向量,以八元数和Clifford代数为工具,给出了掌纹提取的几个新算法。这些算法改进了张大鹏等人采用的按逐个方向提取再
信道编码技术为数字通信系统的可靠传输信息提供了有效的保障,低密度奇偶校验(LDPC)码是现今性能最接近香农限的一种信道编码。本文基于空间咨询委员会(CCSDS)推荐的深空通信
近年来,生化恐怖袭击事件日益增多,生化毒物释放后,会感染大量人群,且会对人体造成重大损害。及时监测出生化恐怖袭击事件,在生化恐怖袭击事件发生后,尽早地识别出毒物,有助于最大限
立体视频系统是一种面向未来的能够提供立体感和交互功能的视频系统,可广泛应用于数字化医疗、消费娱乐和远程教育等领域。立体图像在立体视频系统中经过采集、编码、传输、
由于可以方便的管理IP地址,动态的为网络中的客户端分配地址,从而方便的进行网络配置,DHCP服务成为网络基础性服务,在现代网络体系架构中被广泛采用。为了防止DHCP服务器的单