论文部分内容阅读
支持向量机是在统计学习理论的基础上发展起来的新一代学习算法,该算法具有全局最优、推广能力强等优点,广泛应用到了语音识别,图像识别,文本分类,生物信息学等领域。随着支持向量机理论的不断完善与发展,该技术越来越多地应用在很多解决超大规模问题的领域,这时运算时间和计算内存便成为其求解瓶颈。针对这一问题,人们提出了并行支持向量机的解决方法。本文以此为研究背景,展开了对并行支持向量机的相关研究工作。
本文详细探讨了并行支持向量机的相关理论,从支持向量机和并行技术两方面入手,对并行支持向量机的理论基础和技术支持进行了深入研究。支持向量机是并行支持向量机的理论基础,在简要介绍了其发展历程之后,对其理论依据和实现算法都进行了深入研究。并行技术是并行支持向量机的技术支持,主要介绍了其软硬件的发展历程及目前的关键技术,着重介绍了计算机集群系统以及在此系统上MPI并行计算环境的搭建。计算机集群系统以其良好的编程性、低廉的价格和极高的性能成为目前并行机的一个主流发展方向,因其特别适合我国的教育、科研部门的需求,故在集群系统上进行的并行支持向量机的研究具有重要的实际意义和很好的推广价值。
本文介绍了目前并行支持向量机的发展情况,对其基本模型和改进算法都进行了深入研究。在这一部分,着重介绍了Cascade PSVM并行支持向量机的设计模型。本文详细论述了所提出算法的解决思路,对具体设计实现进行了详细描述,并通过实验对其性能进行了详细评价。
为了进一步提高支持向量机的分类精度和泛化能力,本文研究讨论了一种抗噪音的支持向量机学习方法,并将它应用于并行支持向量机。此方法克服了支持向量机对于干扰分类的噪音点的影响,为分类问题的训练样本去噪音修剪提供了一种行之有效的方法,具有一定的实际意义和应用价值。
最后,在由DNA序列生成的生物数据集上,对Cascade PSVM和AN-PSVM进行了测试,给出实验结果并对实验结果进行深入分析得出了相关结论。关于AN-PSVM的实验结果表明,应用抗噪音学习方法的并行支持向量机算法在提高训练速度的基础上,对于混杂程度较高的分类问题,具有良好的分类精度和泛化能力。