【摘 要】
:
针对生物组学数据普遍存在的高维小样本和样本分布不平衡问题,提出基于粒子群优化分类模型选择算法.该算法中粒子编码由样本平衡模型、特征选择模型和分类模型及超参数构成,
【机 构】
:
深圳大学信息工程学院,深圳大学计算机与软件学院
论文部分内容阅读
针对生物组学数据普遍存在的高维小样本和样本分布不平衡问题,提出基于粒子群优化分类模型选择算法.该算法中粒子编码由样本平衡模型、特征选择模型和分类模型及超参数构成,粒子种群以达到以生物组学数据最佳分类性能为目标,通过对粒子的速度和位置进行迭代更新,得到模型组合及超参数的最优解.在8组真实生物组学数据集上的实验结果表明,所提模型选择算法能够避免人为选择所带来的主观偏差,提高最佳分类性能和稳定性.
其他文献
为抑制色噪声对多信号分类(multiple signal classification,MUSIC)算法估计性能的影响,提出利用延时相关消除色噪声的二阶预处理方法.以L阶滑动平均(moving average,MA)模型为色
加速器质谱( accelerator mass spectrometry, AMS)是基于加速器和离子探测器的一种高能质谱,属于一种同位素质谱( mass spectroscopy, MS),它克服了传统MS存在的分子本底和同量
济宁方言属于中原官话中的蔡鲁小片,在声调方面与周边其他方言不同,而且城市内部方言使用情况也存在细微差异。利用Praat软件,以实验语言的方法,对山东济宁方言单字声调进行