论文部分内容阅读
20 世纪90年代由Vapnik 等人在数据挖掘领域提出的支持向量机是一项新技术。它利用二次优化方法解决了“过学习”和“维数灾难”等传统问题。无论是理论方面还是算法研究方面,支持向量机都取得了良好的效果,目前已成为学者们研究的一个热点。
支持向量机在两类分类问题上的研究和应用非常成功,但是目前出现越来越多的多分类问题,所以将支持向量机从两类分类问题推广到多分类问题是研究的一个发展趋势。
最大间隔支持向量机方法划分多类为两类分类问题时,每次倾向于划分出一个类别,效率很低。类间间隔矩阵方法曾提出以提高效率,但该矩阵每次计算两类之间间隔耗时长,计算量依然很大。针对这种缺点,本文给出了类中心距离矩阵方法,用类中心距离代替类间间隔作为矩阵元素。对于多分类问题中样本点数量多,类别模糊且有孤立点的情况,本文把两类去边缘算法推广到多类,并给出了基于类中心去边缘多类模糊支持向量机方法。这种思想改变了传统支持向量机最优超平面对孤立点的敏感性,在训练前去掉不大可能成为支持向量的部分样本点,使对应的优化问题维数减小,并且减小了对内存和计算量的要求,提高了效率。