论文部分内容阅读
近年来,由于评估的准确性严重影响到金融机构的损失大小,信用评估问题得到了金融机构越来越多的关注。目前学者们已经提出很多方法用于解决信用评估问题。这些方法概括起来主要分为两大类:基于统计学的方法和基于非统计学的方法,前者主要包括线性判别分析、logit分析和probit分析等,后者主要包括支持向量机(support vector machine,SVM)、人工神经网络(artificial neural network,ANN)和决策树(decision tree,DT)等。尽管研究表明基于非统计学的方法取得了比较好的分类性能,但是单一模型用于解决信用评估问题存在着一定的局限性,后来学者们又提出了用集成学习(ensemble learning)解决该问题。然而,集成学习需要多个基分类器,这样增加了时间和空间复杂性,同时泛化能力差的基分类器也影响着集成系统最终的分类效果。然而在原始的集成系统中选择一个子集用于构建集成系统可以很好的解决这个问题,这种方法被命名为选择性集成(ensemble selection),或者也可以称之为集成剪枝(ensemble pruning)。本文提出了ELMsGraspEnS算法用于解决信用评估问题。该算法用ELM作为生成集成系统的基学习机,GraspEnS作为集成剪枝算法在原始的集成系统中选择一部分子集,因此ELMsGraspEnS继承了ELM和GraspEnS的优点。ELM算法的学习速度非常快,具有优越的泛化性能,并且可以有效的解决局部最优和过拟合问题。GraspEn S算法是GRASP算法在集成剪枝方面的应用,是一种组合优化的启发式算法,不仅具有了贪婪集成剪枝算法的优点,并且可以避免贪婪集成剪枝算法所具有的局部最优问题,另外,该算法还可以实现多点开始搜索。实验部分也表明了新提出的ELMsGraspEn S算法具有很好的分类效果。然而GRASP算法是一个无记忆算法,即在GRASP算法的迭代过程中无法利用前面迭代的信息,Path-Relinking算法是一个加强算法,融合GRASP和Path-Relinking可以避免GRASP算法中所存在的问题。鉴于此,本文提出了另一种PRelinkGrasp EnS算法用于解决信用风险评估问题,该算法也是用ELM算法作为基学习机,所不同的是在生成原始的集成系统时,用了Bagging技术,这样增加了基分类器的多样性,该算法用融合了GRASP和Path-Relinking用于选择性集成,这样不仅具有GRASP算法的优点,也结合了Path-Relinking的优势,使得PRelinkGraspEnS算法是一个有记忆的算法,实验结果表明新提出的PRelinkGraspEn S算法不仅具有优越的泛化性能,还可以加快收敛速度。