论文部分内容阅读
近年来,P2P贷款行业高速发展,已成为我国重要的金融产业之一,为我国经济发展带来了诸多的机遇。P2P贷款在为个人融资带来便利的同时,也存在贷款违约率高的问题,阻碍了P2P贷款行业的正常发展。P2P贷款信用风险评价研究也成为企业与学者们关注的重点。随着人工智能浪潮的来袭,基于机器学习的P2P贷款信用风险评价方法以精准的预测精度受到了P2P贷款平台和学者们的青睐,但现有研究仍存在不足。一方面,以贷款违约率最小化或预测准确率最大化为目标的机器学习方法,无法保证投资者在P2P贷款投资过程中收益的最大化;另一方面,与逻辑回归和评分卡等传统信用风险评价方法相比,基于机器学习的P2P贷款信用风险评价方法缺乏可解释性,预测结果无法被投资者与P2P贷款平台完全信任。针对上述问题,本文进行了以下两方面研究。(1)针对机器学习方法无法保证P2P贷款投资者收益最大化的局限,本文采用遗传算法对P2P贷款信用风险评价中表现较好的随机森林模型进行了改进(GA-RF),提出了以投资者收益函数(Profit score)为目标的基于GA-RF的信用风险评价方法。本文首先从投资者实际收益与实际损失和潜在收益与潜在损失四个方面,构建了投资者收益评价函数Profit score,并以此为目标,采用遗传算法对随机森林中决策树组合进行优化。对比实验采用Lending Club借款平台真实贷款数据,实验结果表明,所提出方法与现有方法相比能够有效的提高投资者收益,保证投资者收益的最大化。(2)针对基于机器学习的P2P贷款信用风险评价方法缺乏可解释性的问题,进行了探索性的研究,提出了一种面向可解释信用风险评价的改进教学式方法。该方法在传统教学式方法基础上,引入了基于Weight Synthetic Minority Over-sampling Technique(Weight-SMOTE)的伪数据集抽样方法,促进了决策树对于底层黑箱模型中正确且高价值的映射关系的学习能力。同时针对现有保真度评价方法的局限,提出了真保真度评价方法,以有效的衡量决策树对于底层黑箱模型中正确映射关系的学习和模拟能力。实验结果表明,本文所提出方法能够有效的辅助投资者与P2P贷款平台理解信用风险评价的黑箱模型。本文所提出的基于随机森林的P2P贷款信用风险评价方法研究,可进一步丰富P2P贷款信用风险评价的理论方法体系,并推动机器学习方法在P2P贷款信用风险评价中的应用,具有较好的实际应用前景。