论文部分内容阅读
随着描述事物复杂程度的提高,需要处理的特征维数越来越高,同时特征中的冗余部分相应地增多。利用特征选择减少特征中的冗余部分,提高模式分类的效率和准确性,是目前的研究热点。本文讨论了特征选择的研究现状、基本理论和方法,研究了特征选择的搜索策略、评价准则和选择模式,具体完成的工作主要有以下三个方面:1)提出了基于改进遗传算法的并列式多准则特征选择算法。首先,针对基本遗传算法用于特征选择精度不高、过早收敛的问题,对其进行了改进:采用自适应交叉和自适应变异操作,并引入了链式智能体结构,智能体间通过竞争实现优胜劣汰,改进后算法的收敛速度和解的质量都得到了提高。然后,将改进的遗传算法用于特征选择。为了提高单评价准则特征选择算法的性能,本文提出了并列式多准则算法:分别基于单个准则选出满意特征子集,然后通过某种评价体制得到最终特征子集。实验结果表明,并列式多准则算法性能优于单准则算法,能有效去除冗余特征,降低特征维数,提高分类准确率。2)提出了基于改进遗传算法的轮循式多准则特征选择算法。与并列式多准则算法不同,该算法的思路是依次采用各个准则进行特征选择,利用后面的准则对前面的准则进行补充、修正,直到所有的评价准则全部遍历完为止。实验结果表明,轮循式多准则算法比仅采用单个准则的特征选择算法准确率更高。3)提出了比例混合模式特征选择算法。将filter模式和wrapper模式有机结合,提出了比例混合模式的特征选择算法:首先采用基于遗传算法的filter模式进行一次特征选择,然后根据比例系数挑选其中适应值较高的个体进行wrapper模式下的特征选择,如此反复多次,最终找到分类性能较高的特征子集。实验结果表明,混合模式特征选择算法的选择精度与wrapper模式相当,明显高于filter模式,而时间代价远远小于wrapper模式,同时算法的稳定性比单一的filter模式和wrapper模式更好。