论文部分内容阅读
支持向量机(SVM)是九十年代中期发展起来的新的数据挖掘技术,它是建立在统计学习理论基础上的通用学习方法,着重于研究小样本条件下的统计规律。目前其理论研究和实际应用都处于快速发展阶段。 支持向量机主要包括支持向量分类机(SVC)和支持向量回归机(SVR)两个领域。其中支持向量分类机的理论和实际应用研究相对成熟,而支持向量回归机的研究还缺乏广度和深度。针对目前支持向量机研究工作中所存在的问题,本文主要在如下方面进行了研究和探讨: 1.给出了一个广义加权型支持向量回归机。该模型通过引入加权参数和一个灵活可变的凸函数,在支持向量回归机的推广能力和经验风险之间进行平衡,使其可以包含若干种已有的支持向量回归模型。该模型不但拓展了支持向量机的应用形式,而且在核函数的选取和实际风险的确定上都比原有方法有着显著的提高。 2.提出了多维输出的支持向量回归模型。目前的支持向量回归理论多集中于一维输出、多维输入的问题,对于多维输出的情况涉猎甚少。该多维输出模型通过建立基于矩阵的回归超平面,采用迭代式支持向量回归训练方法,可以得到多维加权的回归系数,适用于某一序列上的连续性输入输出问题,并通过实际问题的解决验证了其有效性。 3.将支持向量机的先进理论应用于银行客户分析领域。通过建立不同类型的支持向量模型,解决了包括客户群体分类、信用评估、客户盈利能力预测等客户分析领域的众多复杂问题。对本文所提出的支持向量回归模型进行了检验,并通过对比实验分析了不同情况下支持向量模型的应用效果。 4.在实例的样本训练中,通过引入不确定核参数使核函数的选取更倾向于数据本身的特点。根据信息增益大小确定参数值,提高了支持向量机的训练准确率和推广能力,并通过对比实验说明了不同参数值对结果的影响程度。