论文部分内容阅读
个人信用评分在信贷领域中非常重要。我国网贷业务发展迅速但风险控制仍有不足。Lending Club公司得益于其精确的信用评分模型曾一度成为全球最大的个贷平台,研究其信用评分规则对国内网贷企业进行风险控制有很大的参考价值。本文选取了 2007-2015年间Lending Club公司的信用贷款违约公开数据,以“信用评级”为响应变量构建模型。国内外对于个人信用评分的多分类模型的研究还很少,以往文献常以“是否违约”为响应变量来构建两分类模型。注意到“信用评级”是Lending Club给出的对于客户贷款申请的评级,它将个人信用细分成A-G七个等级,精准且应用效果好。然而,该评级如何得出是保密的。因此,本文尝试探求出能对“信用评级”进行准确估计的多分类信用评分模型,这对国内网贷企业进行信用评级时具有重要参考价值。建模方面,本文使用的编程语言是python,基于机器学习方法构建多分类信用评分模型。本文先选择了逻辑回归、K近邻、支持向量机、决策树、随机森林以及LightGBM进行模型构建,然后基于Stacking和投票法进一步构建集成学习模型。最后,以准确率和调整的f1得分为衡量标准,分析得出LightGBM模型和以LightGBM、随机森林、K近邻为基分类器,逻辑回归为元分类器构造的Stacking模型表现最好。注意到准确率是各类召回率的加权平均,受辛普森悖论的启发,本文发现数据的平衡性会影响模型间的优劣比较。也就是说,基于准确率,利用平衡测试样本进行模型优劣比较的结果,可能会与应用到总体时不同。本文指出,当总体中各个等级占比相差较大时,可能出现如下现象:平衡测试样本下模型B优于模型A,但在实际应用时模型B却劣于模型A。根据平衡测试样本下的混淆矩阵,以及总体中各个等级占比,本文给出了应用到总体时的准确率的修正公式。本文案例中,各模型在数据平衡与不平衡条件下所得到的准确率排序不变,因此本文所选的最优模型不仅有效而且稳健,未受数据平衡性的影响,是有应用价值的。