论文部分内容阅读
本文对不平衡数据集的分类问题进行了研究探讨,提出将数据采样方法与一种改进的SVM(Biased-SVM)结合的方法:首先对原始数据使用Biased-SVM算法学习,然后对SVM的支持向量进行采样,最后再使用Biased-SVM进行分类。在采样方法上,设计了五种不同的采样方案,其中包括SMOTE向上采样方法及其改进、SMOTE方法结合去除错分样本向下采样以及SMOTE方法结合随机向下采样。在公共数据集上进行了实验,实验结果表明,本方法可提高不平衡数据集分类精度,其中SMOTE方法结合随机向下采样的方案在分类精度和运行效率上都取得了较好的效果。