基于蜂群和粗糙集的聚类算法研究

来源 :长沙理工大学 | 被引量 : 3次 | 上传用户:yue_pan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据的爆炸式增长使我们进入了真正的数据与信息时代。如何从海量数据中获取潜在有用的信息,引导人们做出正确的决策,这就离不开数据挖掘。聚类则以其特有的优点,成为数据挖掘领域中的一个活跃的研究课题。但聚类算法也存在一些缺点,研究如何进一步改进聚类算法的不足,来解决社会实践中遇到的难点,具有非常重要的意义。本文主要以传统的聚类算法为基础,探讨了聚类算法存在的不足,然后研究了蜂群算法、粗糙集以及粒计算的理论知识,最后结合改进的蜂群、粗糙集和粒计算改进传统聚类算法存在的不足。主要工作如下:(1)针对传统K-means聚类算法初始聚类中心随机选取、不能处理边界对象、效率低等问题,本文引入了粒计算和粗糙集相关理论,提出了一种基于粒计算和最大最小距离的初始化方法,并利用粗糙集有效处理了边界数据的聚类问题,最后采用均衡化准则函数来得到更好的聚类效果。实验结果表明:该算法准确率较高,迭代次数较少。(2)针对传统K-mediods聚类算法初始聚类中心选择较敏感、全局搜索能力较差、不稳定等缺点,提出了一种基于改进的人工蜂群的K-mediods聚类算法。该算法首先改进了传统蜂群算法初始蜂群和搜索步长随机选取的缺点,然后将改进的人工蜂群进一步优化K-mediods,以提高聚类算法的性能。实验结果表明:该算法降低了对初始聚类中心的敏感度、具有较高准确率和较强的稳定性。(3)为了改进K-means聚类算法存在的局部收敛、稳定性差等问题,本文提出了一种基于变异精密搜索的蜂群聚类算法。该算法利用密度和距离初始化蜂群,并根据引领蜂的适应度和密度求解跟随蜂的选择概率,再通过变异精密搜索法产生的新解来更新侦查蜂,以避免陷入局部最优,最后结合蜂群与粗糙集来优化K-means。实验结果表明,该算法不仅能有效抑制局部收敛,而且准确率和稳定性均有较大的提高。(4)利用蜜蜂交配优化算法思想,提出了一种蜜蜂交配优化聚类算法。该算法依据密度和距离初始化蜂群,并将粗糙集聚类算法作为工蜂的一种编码,以提高算法的局部搜索能力,最后在迭代过程中不断引入随机种群,增加种群的多样性,提高算法的全局寻优能力。实验表明,该算法能有效抑制早熟收敛,且稳定性较强,聚类效果较好。
其他文献
随着通信能力的不断增强以及通信业务的多样化,为了提供下一代网络服务,3GPP在R5版本中引入了IP多媒体子系统(IP Multimedia Subsystem,IMS)。IMS位于3G核心网中,构架于分组域(PS
近年来多媒体应用逐渐成为计算领域研究的热点。为了获得更为卓越的性能,几乎所有的通用处理器生产厂商都为他们的处理器集成了一个或多个多媒体指令扩展部件。针对多媒体应用
伴随着获取视频信息硬件的普及和视频高清化的需求,视频信息数据量快速增长,行业对高性能并行解决方案的需求日益增加,传统使用CPU硬件与串行视频信息处理算法相结合的模式越
分类和聚类是数据挖掘中两种重要的数据分析方法,广泛应用于商业各个方面。传统的聚类方法很难直观反映样本个体与类间关联程度的变化动态。可拓聚类方法在聚类分析过程中引入
随着IT技术的飞速发展,数据库技术的广泛应用尤其是大数据时代的到来,导致在各个应用领域会产生海量的数据。这些数据中包含了许多有用的知识,因此如何发现这些知识显得尤为重要
在众多的无线Ad hoc网络路由协议中,由卡耐基梅隆大学提出的动态源路由(DSR,Dynamic Source Routing)协议非常具有代表性。但是,其路由维护过程控制开销过大、链路失效判断也
随着互联网络和计算机技术的迅速发展,人类进入了以数字信息为特征的信息社会。信息时代在给数字多媒体创作和传播提供诸多方便的同时,也带来了一个严峻的问题——盗版和篡改。
人脸识别技术是利用计算机分析人脸图像,并从人脸图像中提取有用的信息进行身份识别的技术。人脸识别技术的任务之一是人脸鉴别,就是验证某个人的身份是否属实,是一对一的匹配过
数据挖掘是帮助人们在海量数据中发现信息和知识的工具。近年来数据挖掘技术成了智能研究的核心技术,被广泛应用到了诸多领域,引起了学术界极大的关注。在教育领域中,对学生
本文研究Java中对象模型到关系模型的映射问题,其目的就是在Java开发环境中建立一个持久层,将对象模型到关系模型的映射信息在程序代码之外进行集中封装。通过这样一种方式,