论文部分内容阅读
在模式分类问题中,数据往往存在许多不相关或是冗余的特征,从而影响分类的准确性。特征选择作为解决这一问题的有效手段,一直以来都是机器学习中的热点。随着数据规模的增加,原始的特征选择方法已经不满足要求。特征选择可以视为一个动态寻优的过程,而粒子群优化算法是目前群体智能算法中的一个热门的算法,由于其简单、易实现、寻优效率高等特点受到了广泛的关注。粒子群优化算法与特征选择方法的结合也成为了一个研究热点。大量的研究表明了基于粒子群优化算法与特征选择结合是可行的,并且有着良好的性能表现。本文主要在粒子群优化算法本身的改进和特征选择问题与粒子群优化方法的结合两个方面做了一定的工作。首先是对粒子群算法的改进,普通的粒子群算法由于其局限性,往往容易陷入局部最优,在骨干粒子群算法的基础上,提出一种基于干扰因子的自适应粒子群算法,在算法的初始过程中引入混沌模型增加初始粒子的多样性,同时在更新机制中引入自适应因子增加其全局搜索能力,提高算法的寻优效率。其次改进粒子群算法中粒子的局部和全局最优的迭代公式。在更新过程中引入对于特征数目的讨论,特别是在解码过程中引入互信息筛选特征,精简特征子集。特征选择的目的在于利用最少的特征达到最佳的优化效果,以往的研究过程中,因为追求更好的分类效果,而忽视特征子集中的特征数目。最后提出一种基于混合模式评价机制的特征选择算法。将特征选择过程分为两个阶段,第一阶段采用基于粗糙集的过滤模式评价机制,第二阶段采用基于邻近算法的封装模式评价机制。为了验证上述提出的理论,选择不同类型的数据集上进行分类实验,得到的实验结果验证了所提出算法的有效性和实用性。