论文部分内容阅读
数据分类一直是数据挖掘领域中的一个重要分支,随着信息技术和互联网的飞速发展,传统的方法已经不能满足人们的需要。蚁群算法是近年来一种新兴的群智能算法,在解决大规模组合优化问题中取得很好的效果,并在数据分类的解决中表现出了很好的发展潜力,具有广阔的发展前景。然而,现有蚁群算法的内在机制存在不足,限制了其性能的充分发挥。因此,提高数据分类应用中的蚁群算法性能,具有很强的理论和现实意义。 本文首先对TSP问题和数据分类的规则提取过程进行了对比研究,并利用TSP问题模型来建立数据分类的数学模型,然后通过蚁群算法对模型进行处理,得到数据分类所要提取的规则。在此过程中,本文分析了现有蚁群算法在内在机制方面的不足并进行了改进。本文的创新工作主要包括: 1、针对蚁群的“近视”效应,提出了“贡献边”的概念,并据此引入“贡献函数”对蚂蚁的选择策略进行改进,使得蚂蚁能够具有更全面的全局认识; 2、将“贡献函数”应用到信息素平滑机制中,使得算法在接近收敛的情况下动态地根据“贡献”大小对信息素含量进行更新,保证了搜索空间的多样性,进而提高了算法对全局最优解的获取能力; 3、针对蚁群选择策略的“盲目性”所导致的算法低效问题,引入“信息段”,使得算法在不降低解的质量的前提下,动态降低搜索空间的维度,提高了算法的性能。 最后,本文实现了蚁群算法解决TSP问题和数据分类的原型系统,并以此为基础对改进算法进行了性能测试。实验结果表明,相对于AntMiner和CN2算法,本文的改进算法提取出的分类规则能够更精确地预测未知分类的数据,并且分类规则更简单、更易理解。