论文部分内容阅读
P2P网络借贷是一种较为新型的商业借贷模式,通过这样的一个平台,可以将社会上存在的小额闲散资金聚集起来,然后将这些资金借给那些有资金需求人群。通过互联网的方式进行借贷,其致力的客户群为传统金融无法触及的用户。自从这种借贷模式上线以来,就极大的弥补了传统借贷模式的不足,因此在全球范围内也取得了极大的认可。但是从长期来看,P2P网贷的发展一直处于摸索阶段,并没有能够健康稳定的发展下去。目前来看,大部分的P2P网贷公司的规模仍然较小,与之相对应的是,这些网贷公司对于风险的管控能力往往较为低效,应对突发事件的能力通常也较为低下。而在P2P网贷企业面对的这些风险中,最主要的风险就是个人信用风险。本文针对Lending Club交易数据对个人信用风险评估预测进行研究,通过对其数据进行贷款违约预测,可以帮助平台解决信息不对称的问题,为投资人提供一定的参考意见,同时为我国P2P信用风险评估体系提供一定的参考意见。虽然对于这个问题的评估方法很多,但是大多数还都是基于机器学习的方法进行评估预测。然而,这些传统机器学习方法往往受主观因素的影响较大,通过传统机器学习对信用风险进行识别时,往往需要人工设计特征,而人工设计特征时,往往较为主观,同时需要大量的时间。因此预测效果往往不够高效且不够准确。近年来,深度学习方法逐渐走入人们的视线,受到越来越多的关注。在这些深度学习方法中,卷积神经网络(Convolutional Neural Network,CNN)是一种经典而广泛应用的学习方法。本文试图将这种深度学习方法运用到对P2P网贷信用风险度量中,以便能够取得更好的预测效果,能够服务于P2P平台以及平台投资者。因此,本文以Lending Club网站数据为例,首先通过分析网站用户基本信息得到违约用户的基本画像,然后通过SMOTE方法解决数据集不平衡的问题,然后利用卷积神经网络模型进行预测,并通过对模型参数调优进行模型优化,以提高预测结果的准确率。最后将预测效果与利用其它传统机器学习方法得到的预测效果进行比较。结果发现,基于卷积神经网络模型的P2P网贷个人信用风险识别对违约客户的预测准确率为86.20%,而Logistic模型对违约客户的预测准确率为70.82%,随机森林的违约客户预测准确率为84.27%。因此CNN模型预测准确率是高于其他传统机器学习方法的,能更准确地评估平台借款人的信用风险违约概率;同时,由于CNN模型在进行信用风险识别时可以不断地自动地从交易数据中学习特征,因此在P2P网贷交易数据不断扩大时,CNN模型相比传统方法可以节省大量的时间成本和人工成本。因此,本文建立的模型在互联网金融行业的信用风险评估领域具有更多优势。本文将CNN模型运用到P2P网贷信用风险识别,并进行应用场景分析,将卷积神经网络运用到具体的商业场景中去,为P2P网贷平台以及平台投资者提供更为高效的识别模型,提供一定的参考意见;同时,卷积神经网络这些深度学习算法不仅仅能运用到P2P网贷平台中,对消费金融等行业也能提供一定的参考意见。