论文部分内容阅读
集成学习系统是近年来机器学习和模式识别领域中的研究热点。由于其在处理维数高、样本少和数据结构复杂的这类问题中拥有独特的优势,最近已有越来越多针对基因微阵列数据的研究中使用了集成学习方法。随着微阵列技术的不断发展,我们将面临更多的基因微阵列数据,传统的方法处理高维小样本数据时面临很多挑战,因此,需要设计新的算法模型来分析和处理这类数据。 本文针对基因微阵列数据的分类进行了研究,基于集成学习和粒子群智能优化设计了两种新的算法来对基因微阵列数据进行分析和预测,所取得的成果如下: (1)设计了基于粒子群优化的集成特征选择方法:首先通过filter方法筛选出候选基因集,并使用粒子群优化算法进一步实现特征选择,用优化后的特征子集组构建基分类器以形成集成特征学习系统。 (2)提出了结合聚类思想的集成独立分量选择方法:首先进行基因特征聚类,形成多个基因特征子集,并对每个子集进行独立分量变换,然后使用粒子群优化算法选择合适的独立分量子集,在此基础上构建基分类器组成集成独立分量选择系统。 在三个公开的基因微阵列数据集上进行了实验验证,实验结果验证了本文所提出的两种方法在基因微阵列数据分类预测问题上的有效性。