论文部分内容阅读
多分类器融合的目的在于结合每一个基分类器分类性能上的优点来共同预测,从而能够获得比单独使用某一个基分类器分类效果都更好的分类模型。多分类器动态融合技术是多分类器融合技术的一个重要分支,它的主要思想是针对不同的待分类样本动态的选择不同的基分类器进行融合,以达到更强的灵活性和更高的准确性。目前多分类器融合技术已成为一个研究热点,研究成果层出不穷。但该技术仍然存在部分问题,如:多个分类器之间的差异性构建、基于KNN的动态筛选基分类器组合的条件设定以及加权融合中权重的设定等。针对上述存在的不足之处,本文的主要研究如下:1.针对后续动态融合算法的适用范围,本文首先提出了一套数据筛选规则。该规则通过寻找近邻样本构成能力区域,判断所有基分类器在该能力区域能否全部正确预测,如果所有基分类器能够全部准确预测这些近邻,则该样本不需要进行动态融合。反之,则构建成为子测试集。2.针对KNORA-ELIMINATE-W方法筛选以及集成时的不足,本文提出了改进的KNORA-ELIMINATE-W方法,该方法通过寻找子测试集样本的近邻样本构成能力区域,测试基分类器在该能力区域的性能。如果某个基分类器能够正确预测这些近邻,则该基分类器作为基分类器集中的一员。反之如果不存在基分类器能够正确预测这些近邻,则采用局部准确率最高的基分类器的预测结果作为分类结果。3.为了进一步提高分类准确率,本文提出了基于Stacking的两层混合算法。其中第一层模型采用单一分类器算法,第二层采用改进KNORA-ELIMINATE-W方法。最后为了评估本文所提出方法的分类性能,本文将提出的方法与其他方法进行了实验对比,准确率提升了2%左右,证明了其有效性。