基于随机森林的P2P网贷借款人信用风险评估研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:nm76181156
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
融合互联网技术与金融科技的P2P网贷正从扩张式发展步入合规化发展阶段,已成为解决借贷市场中短期小额资金流动性问题的重要渠道之一。在以P2P网贷平台为纽带形成的双边市场中,借款人、网贷平台和投资者等利益相关方之间尚未实现完全信息对称化,且当前P2P网贷所服务的借款人多为央行征信报告中的信用白户,故如何以较低成本、更高效率且更精准地甄别网贷借款人,是数年来学者们和业内人士一直致力于解决的核心问题。本文运用前沿的随机森林算法,在P2P网贷环境下构建借款人的信用风险评估模型,对借款人的信用风险进行多分类预测,探究这一机器学习模型对P2P网贷市场的适用性,为网贷平台对借款人的信用风险控制提供新的研究方向。通过引入随机森林算法,以借款人的信用评级作为目标变量,选取人人贷平台中的17917个散标借贷交易项目作为实验样本。在变量选择中,运用importance()函数、varSelRF包和随机森林模型变量选择方法综合得到最优变量组合。在模型构建中,针对原始数据集中不同信用评级的借款人数量分布严重不平衡的变量,先对训练集数据予以SMOTE均衡化处理,再经过参数优化,得到最优随机分割变量数mtry和决策树数量ntree。据此,基于最优参数组合即得到P2P网贷借款人信用风险评估的随机森林模型。研究结果表明:随机森林算法适用于P2P网贷环境下借款人的信用风险评估,且具有较好的分类性能;在候选的35个变量中,实地认证、年利率等变量对借款人的信用风险评估影响较大,这对于网贷平台和投资者的贷款决策具有启发意义。此外,基于最优参数组合构建的随机森林模型的评估结果表明,该信用风险评估模型所得到的借款人信用评级对借款人的信誉要求较人人贷平台更为严苛。
其他文献
<正>近年来,我国的建筑和建筑装饰事业蓬勃发展,盛况空前。随之也产生了一个引人注意的现象,那就是欧式古典建筑装饰图案在许多的建筑领域里得到了广泛的应用。上海的情况尤
假单胞菌具有现有微生物中丰富的酶库,目前研究单一的假单胞杆菌发酵产脂肪酶的较多,而忽略了假单胞杆菌协同发酵产脂肪酶的能力。由此本研究选取假单胞菌种中具有代表性的荧
战前制定合理的火力分配方案,可以优化资源配置,用最小的代价获取最大的战场收益。综合考虑攻击、资源和毁伤概率等约束条件,建立了火力分配多目标优化数学模型。提出了一种
<正>改革开放四十年,也是民营经济迅猛发展的四十年。民营经济是中国改革的晴雨表,正所谓"春江水暖鸭先知",改革每前进一步都是对民营经济的再松绑,改革每前进一步也是民营经
在当代商业环境中,社交媒体的作用并不仅仅是传播渠道,而能够从根本中扮演商业模式迭代更新的作用。文章从介绍社交媒体商业化理念及运营落地的方法入手,分析探讨社交媒体商
天然C-反应蛋白是固有免疫系统中一个进化保守的蛋白,由5个相同亚基通过非共价键形成五聚体结构.C-反应蛋白不仅作为监测炎症的分子标志物,也是炎症发展的直接参与者.C-反应
<正>幂级数是一类重要的函数项级数.求和函数是幂级数运算中的一种基础运算,这里,我们简单总结一下求幂级数和函数的方法.一、幂级数和函数的分析性质设幂级数∑∞n=0a_nx~n
<正>加强新农村文化建设,满足广大农民群众多层次、多方面的精神文化需求,是建设社会主义新农村、构建和谐社会的重要内容。乡镇文化服务中心的图书室作为最贴近农民的基层图
<正>近两年,"共享"成为中国经济界最火热的词汇之一。共享单车获得的巨大成功,刺激着一干创业者把能想到的资源都要拿来"共享"一把。在物流行业,自然有人想到了物流装备的共
本文对金圣叹对诗的解析进行了评述。文章认为,金圣叹的诗歌解析法,在前人注释、评点的基础上,又朝前迈进了一大步,并且产生了很大影响。这些诗歌解析著作实际上是我国
期刊