论文部分内容阅读
近年来,互联网金融市场的兴起获得了大众瞩目,其中,创新型融资模式的代表——P2P网络借贷以其更低的融资门槛,更便捷的融资操作及更高的投资收益等特点,获得了借贷双方的偏好。至2015年12月底,我国P2P网络借贷运营平台已经达到了 2395家,爆发性增长同时诱发诸多问题,仅2015年一年,停业、问题平台数量就达到896家。随着监管趋严,问题平台数量占停业及问题平台的比例已由2015年底的60.38%降低到2016年6月的44.68%,意味着P2P行业的风险防控重心正从平台的恶意经营转移至业务本身。对平台和借款者而言,面临的最大的借贷风险为信用风险,借款人的信用状况关系着投资者的投资回报和平台的声誉问题。因此,根据行业特点,结合行业.发展状况和现实需要,建立一个尽可能保障投资者的合法权益,又降低平台的评估成本的信用风险评估模型具有重要的现实意义。过去对P2P借款人信用风险评估往往采用了以准确率为评判标准的评估方法,然而误判违约用户和误判正常用户存在着明显的代价差异,传统的评估方法并不能完全适用。基于以上背景,本文基于代价敏感的视角,运用数据挖掘技术研究如何对P2P网络借贷借款人的信用风险进行评估。主要做了如下的研究工作:(1)通过对国内P2P网络借贷信用风险评估现状及各种评估方法的深入分析,从应用领域的适用性出发选择了决策树作为评估模型。(2)引入C4.5cs模型解决P2P行业信用风险评估的代价敏感问题,根据P2P行业交易特点分别从投资者和平台的角度定义了代价矩阵。(3)运用爬虫技术从国内代表性平台“人人贷”获取借贷数据,运用单值填补法、基于MDLP停止准则离散化方法等操作对数据进行预处理,并在Matlab平台上实现C4.5cs模型,通过准确率、误判率、ROC曲线、代价减少占比等评估指标得出该模型不仅具有较好的评估能力,能够大大降低误判损失,同时还能得到清晰的评估规则的结论。(4)根据实证结果和现状分析,对完善P2P网络借贷信用风险评估提出针对性的建议。