基于微粒群优化算法的聚类分析及应用

来源 :中北大学 | 被引量 : 0次 | 上传用户:jingliang3334
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析作为数据挖掘和模式识别的主要方法之一,越来越引起人们的关注。在众多的聚类方法中,C-均值算法是目前最实用也最受欢迎的算法之一。它不仅有着深厚的数学基础,而且在很多领域获得了成功的应用。但C-均值聚类算法的致命缺陷是对初始值比较敏感,往往只能得到模型的局部极值点,造成聚类结果的随机性,影响聚类的效果。微粒群优化算法(particle swarm optimization, PSO)是一种应用广泛的全局优化算法,它的主要特点是结构简单、易于实现、通用性强、具有记忆功能。因此,把微粒群优化算法同C-均值算法相结合,既能发挥微粒群优化算法的全局寻优能力,又可以兼顾C-均值算法的局部寻优能力,从而更好的解决聚类问题。本文主要对微粒群优化算法在聚类分析中的应用进行了研究。首先采用模糊球壳聚类算法FCSS(fuzzy c spherical shells)分别对非同心球壳状数据集和同心圆数据集进行了聚类实验。结果发现FCSS算法对非同心球壳状数据集分类的效果还是比较好的,而对于同心球壳状数据集的聚类基本无效。因此提出使用标准微粒群优化算法与FCSS相结合的球壳聚类方法(PSO-FCSS)来解决同心球壳聚类问题。通过实验发现:在对同心圆数据集的聚类问题上,PSO-FCSS算法与GA-FCSS算法(基于遗传算法的模糊球壳聚类算法)相比,有相对较快的收敛速度,但是全局收敛性较差,表现为随着数据点数和聚类类别数的增加,PSO-FCSS算法的聚类效果明显不尽人意;而GA-FCSS算法具有较好的全局收敛能力,但其缺陷是收敛速度慢。综合上述因素,将GA(遗传算法)、PSO算法以及FCSS相结合,提出混合球壳聚类算法PSO-GA-FCSS,用遗传算法的交叉因子和变异因子来优化微粒位置,增加其收敛到全局最优解的能力,用于解决球壳状数据的聚类问题。此外,本文还将基于微粒群优化算法的C-均值聚类算法应用于电信企业的客户细分中。在细分过程中,先采用微粒群优化算法产生初始解群后再进行迭代更新,在算法后期对新产生的个体用C-均值算法进行优化,提高算法的收敛速度。这样,算法基本不存在随机寻优的退化现象,后期收敛比较平稳,很少有波动现象,可以很好的解决客户分类问题,对企业决策和运营有很大的指导意义。
其他文献
随着计算机技术的快速发展,图像处理得到了越来越多的关注和研究。基于偏微分方程的图像处理方法具有较强局部自适应性、形式上的规范性、高度的灵活性三大优点,及各向异性的扩
本文主要是在摄像头固定,与背景相对静止的条件下进行的目标检测、提取与跟踪。运动目标检测是指判断监控区域内是否有目标的闯入,检测是否有与背景存在相对运动的物体存在;目标
“教”与“学”永远都是学校的主题,如何能及时、全面地了解和监控教学情况,使教师及时把握教学的内容和方向,为校院领导提供决策支持,为学生提供反馈信息的窗口,切实提高教学质量
支持向量机是在统计学习理论基础上发展起来的新一代数据挖掘方法,在文字识别、手写体识别、图像分类、生物信息学等领域中获得了较好的应用。与传统的神经网络等方法相比,它
时间价值可以分为资源价值和行为价值。资源时间价值是从宏观的角度来说,主要用于合理、客观评价交通投资项目的经济效益,提高项目决策的科学性;行为时间价值是从微观的角度
大循环户外体育活动是合理利用场地进行体育锻炼,以促进幼儿体格健康发育为目的,尝试创设不同的运动区域,投放不同的运动器械,打破幼儿班级界限,让幼儿充分享受运动的快乐.
本文主要研究了环Fq+vFq+v2Fq,(v3=v)上的斜常循环码与其对偶码以及利用有限环上Fq+uFq+vFq+uvFq(u2=1,v2=1)上的循环码构造量子码,具体内容如下:  (1)第一部分主要考虑环R=Fq+v