论文部分内容阅读
随着商业银行的快速发展,个人信用风险评估是商业银行至关重要的领域。对商业银行来说,区分出好的借贷者和坏的借贷者是非常重要的。已初步开发出适合中国市场环境的个人信用评估体系,对个人信用评估模型建立的研究也取得了很大的进步。
Vapnik等学者首先提出了实现统计学习理论中结构风险最小化原则的实用算法-支持向量机。支持向量机(SVM)具有结构简单、优化性好和好的泛化能力。在最近的机器学习研究中,核的学习得到了人们的极大关注。众所周知,多核学习(MKL)是学习核函数的常用方法之一。以前的研究已证实:多核学习通常能使核函数进行合适的组合,从而能提高应用的性能。主成分分析法用于研究如何将多个变量指标间的问题化为较少的几个新指标问题。这些新的指标彼此互不相关,又能综合反映原来多个指标的信息,是原来多个指标的线性组合。
支持向量机与多核学习已经广泛应用于分类问题中。然而,如果训练数据有太多的噪音点,支持向量机和多核学习的泛化能力将会受到削弱。因为这会带来收敛速度慢和低的判别精确率。在本论文中,提出了基于主成分分析的支持向量机和多核学习的分类器模型,即用主成分分析法降低数组的维数,然后用主成分去替代原数组,这样,运算速度和分类精确度将会得到改善。
本文最后,PCA-SVM方法和单个SVM方法应用于3个个人信用风险评估数据:中国个人信用数据、澳大利亚个人信用数据和德国个人信用数据,并且就运算时间和判别精确度进行了比较。结果是PCA-SVM方法适用于大规模数组,既能使其判别性能接近于原数组单个SVM模型的判别性能,又能大幅度地减少运算时间。