基于Stacking融合模型与SHAP可解释性的在线借贷违约预测研究

来源 :新疆财经大学 | 被引量 : 0次 | 上传用户:zhiyuanboxue
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着互联网时代的来临以及社会经济的不断发展,银行等金融机构相继推出在线借贷申请业务,互联网企业也围绕贷方机构匹配等借贷周边服务开发了许多在线应用平台。同时,随着数据挖掘技术的不断发展,机器学习算法凭借自身优势被广泛应用于金融风控领域并取得了优异的成绩,然而,目前已有研究中仍然存在以下问题:问题1:基于逻辑回归等传统机器学习算法的借贷违约预测模型有着较好的可解释性,但预测精度有限。问题2:基于集成算法,深度学习算法的借贷违约预测模型预测精度较高,但自身无法提供明确的可解释性,对于公众的说服力不足,无法在拒绝借款需求时给与申请人明确的拒绝理由。总的来看,目前针对在线借贷违约预测的已有相关工作无法兼顾预测性能与可解释性两方面需求;在此背景下,本文提出了一种适用于在线借贷违约预测场景的Stacking融合模型对该问题进行预测;同时为提供明确的业务指导,使用SHAP模型结合融合模型中的XGBoost基模型对在线借贷违约原因进行分析,本文工作主要集中在以下3个方面:(1)结合原始数据实际情况进行有针对性的数据预处理和特征工程,并在此基础上构建多个备选基模型;在所有备选基模构建完成后,借助AUC值,KS值等评价指标对不同基模型的表现情况进行比较分析。(2)在基模型预测结果的基础上,借助RFE特征递归消除算法选择融合模型所使用的基模型,并基于逻辑回归算法构建Stacking融合模型;之后将该模型预测效果与目前已有研究中的模型预测效果进行比较,证明本文模型能够有效对在线借贷违约行为进行预测。(3)在利用融合模型保证预测性能的基础上,为了增强模型的可解释性,基于SHAP模型对影响在线借贷违约行为的关键因素进行分析,为借贷机构提供业务指导和决策参考。实验结果表明,本文提出的Stacking融合模型AUC值为0.7416,较对比研究中的最优模型提升了0.0005,KS值为0.3602,较对比研究中的最优模型提升了0.0008,能够有效对在线借贷违约行为进行预测。同时,通过特征重要性分析发现,申请人信用子等级、借款金额、借款利率以及债务收入比等因素对于最终违约概率影响较大,贷方机构在发放借款时应当重点关注借款申请人这部分特征的情况。
其他文献
网络口碑是人与人之间借助网络平台,对产品、服务、品牌或厂商等信息的评论;旅游形象的网络口碑是游客之间利用网络分享正面或负面关于旅游目的地旅游形象的观点或看法。随着互联网对人们生活的渗透,越来越多的人愿意在网络上分享在旅游目的地游玩的自身感受,这一正面或负面的情感不仅成为影响公众选择旅游目的地的重要因素之一,也成为影响旅游目的地旅游形象的关键要素。本文依据2016年3月1日到2021年4月30日在马
学位
乡村振兴战略是继脱贫攻坚战后的又一场必须取得胜利的战役,在一定程度上也标示着我国人民生活水平进入了一个新高度。脱贫攻坚与乡村振兴有机衔接是我国历史过渡期的一次重要交汇,实现脱贫攻坚与乡村振兴的充分融合,有利于后续第二个百年目标的实现。南疆四地州地区在历史上都是处于基本不发展的状态,上一阶段的脱贫攻坚战给该地区带来了发展活力,振兴南疆乡村是整个乡村系统振兴过程中的重难点,观测其乡村发展动态变化,不仅
学位
发展绿色经济,促进低碳社会建设已成为区域经济发展追寻的目标。江西省也制定了碳达峰的行动计划,如何协调好经济发展与碳减排间的矛盾,在不影响经济发展的前提下,顺利完成碳减排任务,是个值得探讨的问题,因此研究江西省碳排放效率及其影响因素具有重要的现实意义。本文以可持续发展、库兹涅茨曲线、环境技术理论等相关理论为指导,梳理了全要素碳排放效率的相关理论,采用IPCC法计算了2010-2019年的江西省二氧化
学位
在新发展理念之下,我国经济增长由规模和速度型向质量和效益型转变,并急需扭转能源消费和二氧化碳排放量快速增长的局面。2011年,我国陆续开展碳交易机制试点,碳交易机制的实施不仅能倒逼能源结构调整,推进供给侧结构性改革,加快能源清洁化进程,促进产业结构优化,还能有效控制二氧化碳的排放,加强对生态环境的修护与保护,进而实现经济高质量发展,所以碳交易机制与我国经济高质量发展具有内在的一致性。当前,在碳达峰
学位
据国家官方报告显示,钢铁行业的碳排放量一直稳居制造业之首,在全国碳排放量中占比高达15%,因此在“双碳”规划的背景下,钢铁行业的低碳转型尤为重要。然而,低碳转型首要是设备的升级,需要投入大量的资金。但是,在2020年全球疫情的冲击下,钢铁的进出口逆差进一步扩大,导致钢铁行业产能过剩现象严重。本年度钢铁整个行业的利润总额仅为2074亿元,并且整个行业的平均销售利润率仅为4.41%,相比于2019年的
学位
改革开放以来,我国在由计划经济向市场经济的转型中,采取了渐进式的转轨模式。在市场经济体制下,社会经济的有效增长,不仅在于供给的增加,关键在于有效需求的实现。消费作为内需,是经济增长的主要动力。然而我国居民的消费率却逐渐走低,挖掘居民消费潜力,刺激内需,将有效带动我国经济的高质量发展。进一步分析发现,城乡居民的消费水平和消费结构也有很大的差距,城乡消费差距在时间上和空间上均有明显差异。本文的研究内容
学位
化工行业作为“双高”行业的代表,其生产和经营活动对资源和环境造成不可逆转的影响,自然受到政府部门和社会公众的广泛关注。传统高污染行业与当下提出的绿色发展和双碳目标的发展基调出现不一致状态,因此金融机构在审批贷款时需要考虑环境因素在化工企业经营中所带来的影响,以此推进企业尽快符合当前发展趋势。ESG投资理念正是考虑到了企业治理、社会和环境三个维度,因此ESG投资理念对化工企业绿色信贷风险评估具有深刻
学位
新型城镇化指出必须要采取相应的措施走出一条资源节约、环境友好、经济高效、社会和谐、城乡一体化及统筹发展的集约、智慧、低碳、绿色的城镇化道路,坚持绿色发展,实现新型城镇化与生态环境之间的协调发展。随着我国经济的不断发展,绿色发展理念深入人心,如何实现在不断推进新型城镇化的前提下,做好生态环境的保护是我们现在要面临的严重问题。基于该背景,探讨西部地区新型城镇化与生态环境的耦合协调发展水平有着重要意义。
学位
随着各地政府报告中频繁指出建设“消费中心城市”,城市经济形态逐渐由生产型城市向消费型城市转变,人们越来越重视城市作为生活和消费场所的功能。城市消费活力成为评价一个城市是否具有竞争力及发展潜力的重要指标。研究城市消费活力能更好的发掘城市的消费市场潜力,把握城市消费的空间格局,吸引高质量人才的聚集,推动城市经济的总体发展水平,使城市居民更具自豪感和幸福感。本文以西北五省省会城市作为研究对象,结合消费型
学位
针对全国贫困态势由绝对贫困转变为相对贫困的变化情况,本文采用AF双界限法测度新疆农村相对贫困,并利用对数线性模型分析影响农村相对贫困的因素,首先选取经济、教育、医疗和生活环境四个维度11个指标建立相对贫困测度指标体系,计算相对贫困发生率、平均被剥夺指数和多维相对贫困指数,并对多维相对贫困指数进行维度和指标上的分解。然后,将2017年新疆农村多维相对贫困维度数作为被解释变量,建立对数线性模型,对影响
学位