基于类电磁机制的聚类算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:liandakj2005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类是将一组对象根据一定的原则分成若干类的过程。在结果中,相同类中对象的相似度较高,不同类间对象的相似度较低。聚类分析是机器学习的一个重要组成部分,已经被广泛地应用在市场研究、语音识别、故障检验、图像处理和数据压缩等领域中。K-means是一个常用的聚类算法,它是一种基于中心的聚类方法。该算法实现简单、运行效率高、收敛速度快,适合处理大型的数据集合。但是它对初始值敏感,容易陷入局部最优解,从而产生早熟现象。本文在深入分析K-means及其改进算法的基础上,引入了全局优化领域中的类电磁机制(EM)启发方法,然后结合K-means的性能函数,设计了一种新的聚类算法——类电磁机制聚类算法(EMC)。为使初始中心均匀分布,提出了一种基于最大距离积原则的初始中心选取方法;为使EM算法符合聚类问题的要求,调整了电荷量和合力的计算公式;为提高搜索性能和收敛速度,引入了自适应的移动步长算子,并结合这一算子改进了局部搜索和粒子移动过程。实验结果表明,与K-means及其改进算法相比,新算法的平均性能和稳定性都有很大提升,而相对于其它一些同样利用智能优化算法的聚类方法,新算法除了上述优势外,还提高了运行速度。由于智能优化算法固有的复杂性,类电磁机制聚类算法运行在大型数据集合上的时候,效率相对较低。在后续的研究工作中,将从聚类问题自身的特点出发,改进迭代过程中粒子的局部搜索和移动方法,以此来降低类电磁机制聚类算法的运算复杂度,提高运行速度。
其他文献
近年来,随着计算机的普及和应用技术的发展,人们获取数据的能力得到了极大提高。数据流作为数据挖掘的一种新的研究内容,已经出现在各种应用领域。区别于传统的存储在磁盘上的静
集成学习系统是近年来机器学习和模式识别领域中的研究热点。由于其在处理维数高、样本少和数据结构复杂的这类问题中拥有独特的优势,最近已有越来越多针对基因微阵列数据的研
从行为心理学发展而来,介于监督学习和非监督学习的强化学习算法,目前是机器学习研究领域的热点,越来越受到关注。现有的强化学习算法如Sarsa学习算法、Q学习算法等需要大量的存
随着Internet的高速发展,Web上承载的网页数据也与日俱增。一个普通网页上包含的数据一般可以分成两部分:内容块和噪声块,其中噪声块主要包括网页顶部或侧边的导航栏、四周的
聚类分析的目标是在相似的基础上收集数据进行分类,使得各个类之间的数据差别应尽可能大,类内之间的数据差别应尽可能小,即为算法的选择取决于数据的类型、聚类的目的和应用
现今软件定义无线电(SoftwareDefinedRadio,SDR)处理器遇到的核心问题有许多,而本文主要研究面向4G无线通信的基于SDR的变宽度SIMD处理器体系结构模型的设计及其中模块的硬件设
太阳能作为一种新兴的、绿色的、无污染的可再生能源,以其分布广泛,不受地域限制,储量丰富,取之不尽,用之不竭,清洁安全,无污染等独特的优势受到了人们的广泛关注。光伏发电是新能源的重要组成部分,将成为未来太阳能产业和电力产业的发展方向。然而传统的光伏电站的并网方式、最大功率点的跟踪方法对太阳能的利用率和功率的输出都不尽人意,因此太阳能光伏发电的实现需要解决诸多的问题。本文研究了太阳能光伏发电系统的工作
压缩传感理论将信号的采样与压缩同时进行,利用信号在变换基上可以稀疏表示的先验知识,从比香农采样少的多的观测值中重构原始信号。因此,寻找能够更加稀疏表示信号的变换基成为
激光雷达监测数据对于研究大自然的演变规律和气候变化起着非常重要的作用,是预测和分析大气状况的宝贵资料。然而,现有激光雷达监测站点的布局不均衡,数量有限,且观测密度不够。
随着科技的不断进步和智能手机的不断发展,以及智能操作系统在智能移动终端上的不断发展和应用,智能手机已经成为人们获取价值信息的重要手段。并已逐渐影响人们的日常生活方式