基于数据挖掘技术的P2P网贷借款人信用风险预测研究

来源 :重庆理工大学 | 被引量 : 0次 | 上传用户:bosigai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着经济的发展与科技的进步,我国互联网金融得到了空前的发展,作为其重要模式之一的P2P网贷也顺势崛起。P2P网贷相较于传统借贷,其借贷交易行为的发生不再受限于时间和地点,这在很大程度上提高了借贷交易便捷性和社会资金利用率。然而,本质仍属于金融的P2P网贷在给我国经济注入新鲜活力的同时,也不可避免地出现了诸多风险,其中最严峻、也最受学术界和社会关注的风险为借款人信用风险。因此,如何有效预测P2P网贷借款人信用风险具有重要的理论意义与现实意义。本文基于数据挖掘技术,以Prosper平台借款人公开数据集为例,对P2P网贷借款人信用风险进行了研究。首先,在相关文献研究基础上,对P2P网贷、我国P2P网贷及其发展历史与现状进行简要概述;然后探讨了数据挖掘理论及P2P网贷信用风险相关理论,并构建了以随机森林模型为主的数据挖掘模型;接着,对本文研究数据集进行分析和预处理;再接着运用随机森林模型及其他对比模型如Logistic回归模型、支持向量机模型、朴素贝叶斯模型等,对平台调整前后的借款人数据进行训练和预测;最后就各模型对借款人信用风险综合预测效果做出相关的评价和总结。本文的具体研究结论如下:首先,在P2P网贷借款人信用风险预测控制方法上,各数据挖掘模型均能在不同程度上有效预测借款人信用风险,其中集成学习模型——随机森林模型整体预测效果最优,综合性能最为稳定,可优先用于P2P网贷借款人的信用风险预测。因此,借款人信用风险预测模型的构建和应用能有效推进P2P网贷行业信用风险控制建设。其次,运用随机森林特征选择方法进行数据降维,相较于大多数研究利用主成分分析方法进行数据降维来说,其运算效率更高,特征选择结果更有利于后期模型建立。同时,随机森林在作为特征选择方法时,效果较为良好,它能自动选择出重要性程度高的特征,并将结果绘制成可视化图表。该特征选择方法有利于后期模型的输入变量选择,从而提高模型对借款人信用风险的预测能力,帮助P2P网贷行业更加适应当前稳健金融的发展需求。最后,“信用等级”变量能大大影响模型性能。2009年7月1日后的各模型准确率较7月1日之前大大提升,这说明改善“信用等级”变量可有效提高模型的预测准确率,Prosper平台此次变量调整具有一定效果。因此,P2P网贷平台可聘请专业人员以加强“信用等级”信息的收集和预测,优化借款人信用评估指标,以实现对借款人信用风险的科学预测与事前控制,进而促进平台健康长远发展。
其他文献
圣达尔是河南省农业科学院园艺研究所以 HY 16为母本、AT 18为父本杂交育成的优良中熟西瓜品种。全生育期108 d,果实成熟天数为33 d,果实椭圆形,果形指数1.56,果皮黑色,果肉红,平均
波兰园林十分美丽,其特点可归纳为: 一、城市绿化系统合理。园林绿地分布均匀,点(公园、花园)、线(林荫道、绿带)、面(森林公园、居民绿地、菜园绿地、专用绿地等)能有机地相
新疆作为我国畜牧业发展的重点地区,其乳制品行业发展也获得极大重视和长久关注,近年来随着我国经济发展步伐的不断加快,新疆地区乳制品行业上市公司的经营环境也发生了深刻
通过实例介绍了一种内齿圈(中大型零件)内花键线切割返修自为基准找正的过程,方法简便实用。
福州地区夏秋季节,气温高,台风暴雨频繁,严重影响蔬菜正常生长,造成产量低,品质下降。笔者从1990年开始,连续三年在洪山镇双下村应用SZW—14型遮阳网复盖,进行花菜、芹菜早秋
2019年12月25日,记者从中车永济电机公司获悉,首台国产200吨以上氢燃料一锂电池混合能源矿用卡车自卸车成功下线。该车核心控制系统由中车永济电机公司自主研制,开启了矿用卡
由我校材料科学与化学工程学院董知之讲师等人承担的天津市高等学校科技发展基金项目“高聚物微体积元结晶动力学研究”,于2007年7月18日通过了天津市教委组织的专家组验收.
Sandvik(山特维克)发布了AutoMine for Trucks(自动化矿山卡车),可以在地下、地表环境实现自动化卡车运输。此系统将Sandvik智能卡车变成了能不停运转的无人驾驶自动化车辆,
信息化教育改革的不断深入发展将英语教学与网络教育技术深度融合,各种先进的教学平台和网络在线课堂层出不穷,本文对比了大学非英语专业学生在英语混合式教学和数字式教学两
移动通信的飞速发展,对高数据速率、高可靠性的无线通信系统提出了更高的要求。越来越多的系统需要将多个无线射频集成在一个平台下以保证最大的连通性。引入可重构概念到天线之后,使得天线行为能够适应不断变化的系统需求或环境条件,继而可以改善或消除各种限制,并为系统提供多样的功能。可重构天线在避开噪声源,提高信道容量,增加辐射覆盖率,避免多径衰落效应以及提高系统稳定性等方面有着突出的优势,因此可重构天线的设计