基于随机森林的P2P贷款信用风险评价方法

来源 :大连理工大学 | 被引量 : 3次 | 上传用户:musicwen5918
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,P2P贷款行业高速发展,已成为我国重要的金融产业之一,为我国经济发展带来了诸多的机遇。P2P贷款在为个人融资带来便利的同时,也存在贷款违约率高的问题,阻碍了P2P贷款行业的正常发展。P2P贷款信用风险评价研究也成为企业与学者们关注的重点。随着人工智能浪潮的来袭,基于机器学习的P2P贷款信用风险评价方法以精准的预测精度受到了P2P贷款平台和学者们的青睐,但现有研究仍存在不足。一方面,以贷款违约率最小化或预测准确率最大化为目标的机器学习方法,无法保证投资者在P2P贷款投资过程中收益的最大化;另一方面,与逻辑回归和评分卡等传统信用风险评价方法相比,基于机器学习的P2P贷款信用风险评价方法缺乏可解释性,预测结果无法被投资者与P2P贷款平台完全信任。针对上述问题,本文进行了以下两方面研究。(1)针对机器学习方法无法保证P2P贷款投资者收益最大化的局限,本文采用遗传算法对P2P贷款信用风险评价中表现较好的随机森林模型进行了改进(GA-RF),提出了以投资者收益函数(Profit score)为目标的基于GA-RF的信用风险评价方法。本文首先从投资者实际收益与实际损失和潜在收益与潜在损失四个方面,构建了投资者收益评价函数Profit score,并以此为目标,采用遗传算法对随机森林中决策树组合进行优化。对比实验采用Lending Club借款平台真实贷款数据,实验结果表明,所提出方法与现有方法相比能够有效的提高投资者收益,保证投资者收益的最大化。(2)针对基于机器学习的P2P贷款信用风险评价方法缺乏可解释性的问题,进行了探索性的研究,提出了一种面向可解释信用风险评价的改进教学式方法。该方法在传统教学式方法基础上,引入了基于Weight Synthetic Minority Over-sampling Technique(Weight-SMOTE)的伪数据集抽样方法,促进了决策树对于底层黑箱模型中正确且高价值的映射关系的学习能力。同时针对现有保真度评价方法的局限,提出了真保真度评价方法,以有效的衡量决策树对于底层黑箱模型中正确映射关系的学习和模拟能力。实验结果表明,本文所提出方法能够有效的辅助投资者与P2P贷款平台理解信用风险评价的黑箱模型。本文所提出的基于随机森林的P2P贷款信用风险评价方法研究,可进一步丰富P2P贷款信用风险评价的理论方法体系,并推动机器学习方法在P2P贷款信用风险评价中的应用,具有较好的实际应用前景。
其他文献
明清小说是内地汉文化主流话语的代表,在其视野下的云南呈现出危险与希望并存的复合镜像:一方面,遥远、妖异、叛乱构成了云南镜像的三个关键词,前往云南被赋予了一种"生离不
目的探讨多发性骨髓瘤神经系统损害患者的临床特点和发病机制。方法采取回顾性分析方法对我院2011-02—2012-02收治的70例多发性骨髓瘤患者的临床资料进行分析,观察多发性骨
孙思邈及其代表作《备急千金要方》山西中医学院(030024)王晓鹤关键词孙思邈,千金要方晋隋间,社会动荡不安,我国的医药学家虽然在疾病的认识、医方创制、新药发现等方面,都有较大的进步,然
农村电子商务是一种新兴业态,已经渗透到了农业产业链全过程中,并逐步改变农村经济发展方式以及农民生产生活方式。新疆已成为我国向西开放的前沿地带,推进农业现代化以及扶
在现实生活中,一些不确定消息尤其是负面消极消息的传播,可能会影响人们正常的工作生活,可能会影响到社会和政治的稳定。因此,探讨不确定消息的传播规律,研究影响不确定消息
卤化物钙钛矿在太阳能电池、发光二极管、激光器、光电探测器等领域的研究已吸引了众多研究人员的加入,准二维钙钛矿材料以其发光效率见长,所以可用于发光二极管中。本论文的
通过对国内外组织承诺的文献分析,本文大体回顾了组织承诺领域的理论及其相应测量工具的发展,并结合相关研究进行了简要的评述,展望了未来的发展方向。 Through the literat
20世纪90年代末,图画书作为儿童文学领域新兴的一种文学体裁被中国儿童所接受,它是用图画和文字共同叙述一个完整的故事,包括了文学和美术两种综合性的艺术。连环画在我国历
因我国脑瘫患儿基础大,康复周期长,要使脑瘫得到合理的康复治疗,充分合理利用家庭康复已成必然趋势。本文重点介绍家庭环境内脑瘫患儿康复训练的开展,作为主要参与者的监护人
改革开放以来,国际经济稳步发展,国内的经济也取得了辉煌的成就,我国的国际工程承包企业在此背景下也是从无到有、从小到大、从弱到强一步一步发展起来的。国际上“和平与发