论文部分内容阅读
聚类分析就是在没有任何先验知识的前提下,将数据集划分为多个类,这种分类方式可以筛选出区分不同类别的有用特征,在知识分类和信息发现中有巨大作用。对聚类方法和群智能算法进行研究后,发现运用群智能技术解决聚类问题非常有效,因此本文提出基于人工鱼群的K中心组合优化聚类算法,本文研究成果如下:(1)研究已有的聚类方法基础上,提出基于组合优化思想的K中心组合优化聚类方法,构造组合函数和基于组合函数的准则函数,以组合函数进行约束,使聚类准则函数得到最优值,在此基础上引入属性权值和动态类中心的思想,并给出了完整的聚类模型设计,通过应用分析得知此方法对处理大数据集是高效的。(2)在研究了基本人工鱼群算法之后,针对该算法收敛速度慢、寻优精度不高等问题,本文提出了一种改进的人工鱼群算法,重新设定人工鱼视野阈值,对人工鱼的觅食行为引入状态增量,在聚群和追尾行为中改进了拥挤度因子,并且引入了衰减因子约束步长,最后通过Matlab仿真,验证了改进的算法的在稳定性、收敛速度、正确率方面都有提高。(3)通过研究发现K中心组合优化聚类方法由于受到初始化参数影响,很难达到全局最优。针对这种不足,引进改进的人工鱼群算法,提出基于人工鱼群的K中心组合优化聚类算法,给出鱼群编码以及食物浓度函数的设计,该算法以食物源作为聚类中心,自适应的丢弃不可行解,以人工鱼位置信息作为聚类结果,通过实验证明改进的鱼群算法在求解问题上展现出良好的自适应能力克服了陷入局部极值的问题,最后在UCI数据集上的对比实验显示本设计有更好的正确率和聚类效果。