论文部分内容阅读
自进入21世纪以来,随着计算机性能和网络技术的不断提升,我们正在步入一个高速发展的信息化社会。特别是在模式识别、数据挖掘这一领域,越来越多的创新性研究与方法不断涌出,造就了机器学习算法的繁荣。传统的机器学习算法,如逻辑回归算法、BP神经网络算法等,大多是基于梯度下降的方法,来寻找全局最优解。梯度下降法对大量参数的迭代调整需要较长的训练时间,同时也很容易陷入局部极小值点,而达不到理想的训练精度。 极限学习机是一种新型的机器学习算法,其在一定程度上解决了传统算法中存在问题。极限学习机随机地选取输入权值,将样本分类问题转化为一个二次规划问题,而后通过求解一个Moore-Penrose广义逆,即可精确地对数据进行分类。核极限学习机是极限学习机的一种改进方案,其将核方法引入极限学习机中,降低了随机权值带来的不确定性,并提升了极限学习机在线性不可分样本中的训练精度。本文对核极限学习机及其他极限学习机改进方案进行了实验对比,结果表明核极限学习机在分类精度和训练时间上均优于其他方案。目前流行的核函数有很多种,如多项式核函数及高斯核函数,但并未有学者对极限学习机核函数的选取方式进行深入研究。 本文对极限学习机中核函数的选取方式进行了分析和探讨,在前人研究的基础上又引入了一种新的小波核函数,并证明了其作为核函数的可行性。实验表明,不同的核函数在不同数据集上的表现参差不齐,说明了不同核函数的应用领域也不同。为了设计出一种更加通用的核函数,本文将多种核函数采用不同的组合方案进行组合,并通过实验验证了其分类精度。这些组合方案可分为以下六种:线性不加权、基于结果的线性加权、基于模型的线性加权、非线性、基于Adaboost算法和元启发式优化算法的核函数组合方案。实验表明,基于粒子群算法的组合方案在大多数数据集上表现最好。 此外,本文利用多核极限学习机对孕妇、非孕妇脉象数据进行了分类,验证了其应用于实际的能力。实验表明,多核极限学习机能准确地识别出孕妇、非孕妇的脉象,其识别正确率达到了95%以上。