论文部分内容阅读
支持向量机(Suport Vector Machine,简称SVM)是一种基于统计学习理论的新型机器学习方法,是借助于最优化方法解决机器学习问题的新工具。支持向量机是机器学习领域若干标准技术的集大成者,它集成了最大间隔超平面、Mercer核、凸二次规划、稀疏解和松弛变量等多项技术,在若干具有挑战性的应用中,获得了非常好的效果。由于其具有全局最优、结构简单、推广能力强等优点,近几年得到了广泛的研究并广泛应用于模式识别等领域。但是支持向量机方法最初是针对两类别的分类提出的,如何将支持向量机方法扩展到多类别分类(也称为多分类)问题是支持向量机研究的重要内容之一。
本文基于统计学习理论和支持向量机方法,针对多分类问题进行了深入研究。主要研究工作如下:
①支持向量机多分类算法的分析比较。全面总结了现有的基于支持向量机的多分类方法,包括“一对多”、“一对一”方法、有向无环图方法、树型SVM方法等,给出了理论上的性能比较,推广能力的分析,时间复杂度比较;并通过实验对其中几种常用的方法进行了验证与比较。
②提出了一种基于支持向量数据描述算法的SVM多分类新方法。对基于支持向量数据描述算法的多分类方法进行了研究,分析了它的优缺点,并深入讨论了其推广性能一般的原因。针对其存在的不可分区域这个缺陷,提出了一种新的多分类方法(S-MSVM),该方法对每类样本建立一个超球来界定,由于训练好的超球在多数情况下是相交的,选择相交区域的样本单独建立超球,重复该步骤,直到相交区域消失或者相交区域内没有样本点或者超过迭代终止条件。然后对其进行了时间复杂度分析,并通过在多组UCI数据上的实验验证了其良好的推广能力。
③将支持向量机多分类方法应用于孤立肺结节的医学诊断,实验结果表明SVM分类器对恶性结节的诊断效果优于其他方法。孤立肺结节的诊断对临床医生及影像科医生而言是一个极大的挑战,除了其发生率高,孤立肺结节的诊断中精确区别无结节、良性结节和恶性结节是非常困难的,所以研究一种有效的分类方法以辅助医生诊断是非常重要的。本文将仿生模式识别、BP神经网络和SVM分别应用于孤立肺结节的识别中,实验表明三种方法对无结节和良性结节的识别效果相当,但SVM分类器对于恶性结节的诊断效果优于其他方法。