混合属性及混合策略进化聚类算法

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:qian7122011
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类算法是一种广泛应用于数据挖掘、机器学习、图像处理等若干领域的重要技术。进化聚类算法是聚类算法中的重要分支,本文旨在提出两种新的进化聚类算法,即混合属性进化聚类算法和混合策略进化聚类算法。本文对聚类问题和进化计算做了简要的介绍,详细描述和讨论了提出的两种进化聚类算法,并在人工数据集和UCI数据集上对算法进行了性能测试和分析。本文在第二章提出了针对混合属性数据集的进化聚类算法。它基于K原型算法,应用进化计算的框架和算子求得混合属性数据集的合理划分,因此可以被看做是一种进化K原型算法。作为一种基于划分的聚类算法,K原型算法是针对混合属性数据集的著名算法。然而,由于它采用K均值的迭代方式,所以它对初始原型敏感且容易陷入局部最优。进化计算具有全局搜索能力,因此本文采用进化计算操作K原型算法以克服原始算法的缺陷。对人工数据集和UCI数据集的实验表明,本章提出的混合属性进化聚类算法比原始的K原型算法性能更优。本文在第三章提出了基于多种群的混合进化聚类算法,它属于混合策略进化聚类算法的一种。此算法采用多种群策略和一种新的抽取策略以传递父代个体的有用信息给子代。父代个体是从每个候选种群中选出的一个最好个体。整个数据集被建模成一幅无向图,因此本算法使用基于图的KWNC标准作为适应度函数选择个体。此外,进化中还使用了约简策略,以加快运行速度。对于进化收敛后的不同情形,本章设计了相应的终止方案以得到最终聚类结果。对人工数据集和UCI数据集的实验表明,本章算法能够找到比嵌入其中的候选算法和进化K均值算法更优的聚类结果。本文在第四章提出了基于多种群和图搜索的混合进化聚类算法,它也属于混合策略进化聚类算法的一种。此算法采用与第三章算法类似的框架,适应度函数,抽取策略以及终止策略。不同点在于本章用三种不同算法产生层级聚类候选种群,增大了其多样性;此外两种不同的基于图的搜索策略被用于寻找更合理的数据划分。这些方法都大大提高了算法的性能。对人工数据集和UCI数据集的实验表明,本章算法不仅具有第三章算法的优点,并且其对比于其它算法的优势大大增强。最后本章对重要的参数做了分析以更好地阐述算法的特点。本文工作得到国家自然科学基金(批准号:60703107)、国家863项目(批准号:2009AA122210)、教育部新世纪优秀人才支持计划(批准号:NCET-08-0811),陕西省青年科技新星支持计划(批准号:2010KJXX-03),和中央高校基本科研业务费重点项目(批准号:K50510020001)资助。
其他文献
闯红灯抓拍系统中使用到了很多计算机视觉和数字图像处理技术,本文就其中的一些关键性算法展开了讨论,主要针对目标检测、跟踪技术进行了深入的研究和实践,并基于DaVinci技术
多关节冗余机械臂的冗余自由度为实现目标优化和约束控制提供了可能,也同时导致了机械臂的运动学模型的高度非线性化,为逆运动学求解带来了困难。然而,通过将运动学模型和约束/
五自由度摇摆台虽然在少自由度摇摆台中研究较少,但是在设备检测、姿态模拟以及武器发射等领域却有着非常广泛的应用前景,这样的摇摆台在很多不需要六自由度的场合比六自由度
基于生物特征识别、认证系统以其方便、安全性已经得到人们的广泛认可,成为一种不可或缺的身份识别、认证方式。但是随着人们隐私保护意识的觉醒和对信息保密、信息完整性等
随着工业的现代化和高效化发展,各种工业控制系统已经在冶金、电力、石化等各个领域得到了广泛应用。工业控制系统的发展也推动着工业网络化的发展,将无线传感技术与工业技术
视网膜眼底图像近年来广泛用于青光眼、白内障等眼底病变以及会对视觉造成严重影响的糖尿病、高血压、冠心病等疾病的诊断。由于病人规模庞大,眼科专家稀缺,因此基于计算机视
随着生活水平的提高,车辆数量日益增大造成交通堵塞、交通意外事故和车辆废气对空气的污染等交通问题。智能交通系统充分的利用现有的交通基础设施,结合不同学科对交通进行管
测量船在航行或者停泊的时候容易受到风浪、潮汐等复杂洋流的冲击和扰动,导致船载伺服系统无法高精度的跟踪运动目标,同时测量船本身的摇摆和位移带来的误差和惯性力负载,也
随着计算机技术的发展,近几年智能电子产品进入人们的生活,渐渐改变和优化人们的生活。在控制领域,同样感受到智能时代的到来。高速、稳定、可视化、智能化是现代仪表技术的
随着信息论的发展,树图模型近年来物理学,概率论和信息论界的广泛兴趣.Berger和叶中行研究了树图上某种平稳随机场的熵率存在性[2],之后叶中行与Berger又研究了树上PPG不变及遍