论文部分内容阅读
支持向量机(SVM)是基于统计学习理论,借助最优化方法来解决机器学习问题的新工具,是统计学习理论中的结构风险最小化思想在实际中的体现。由于支持向量机出色的学习性能,该技术已成为机器学习界的研究热点,并在很多领域(如语音识别、人脸图像识别、文章分类等)得到了成功的应用。针对支持向量机算法的不足,本文提出了一种预先提取训练样本的方法,将改进的模糊C均值聚类(FCM)与支持向量机结合起来。通过模糊C均值聚类对训练样本进行预处理,提取所有可能是支持向量的样本作为新的训练样本,同时剔除孤立点,从而提高了分类的精度和训练速度。本文将改进的算法应用在医学数据分析中,分别是儿童异常步态分类、心电图分类、心脏病诊断。主要内容如下:(1)对儿童异常步态进行分类。通过比较三种不同核函数组成的分类器,得出采用径向基函数作为核函数的分类效果最好,准确率达到97.51%。将本算法与其它算法进行比较,实验结果表明,该算法能够有效地识别步态变化,较好地解决了小样本数据在步态分类中泛化能力差的问题。(2)对三种心电图进行分类。本文采用数学形态学去除基线漂移;然后采用小波变换的模极大值检测R峰值点;考虑到小波包变换的性能,对采集好的心电样本采用小波包分解提取能量特征;最后使用本算法进行分类,得到的分类结果为97.03%。(3)对心脏病的诊断。分别采用了常规算法和本算法对UCI机器学习库中的心脏病数据进行分类,结果表明,本算法优于常规算法,具有更好的学习能力和泛化能力。综上所述,改进的支持向量机,提高了分类的准确率,具有可行性和有效性。其优良特性表明本算法在医疗诊断中具有很大的应用潜力。