基于模型融合的信贷风控预警系统研究与开发

来源 :山东大学 | 被引量 : 0次 | 上传用户:a_yelang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,消费金融机构中的信贷员在处理客户的贷款申请时,需要对客户进行信贷风险评估,识别出客户的违约风险。信贷员根据机构模型预测的客户违约概率并依靠主观经验,判断每个客户在贷款金额和贷款利率发生改变时引起的违约率趋势变化,确定最终的审批结果,该结果的准确性会受到信贷员自身经验和知识水平的限制与影响。为了实现对借贷者信贷风险的准确评估以及违约概率趋势变化的量化分析,本文研究并开发了一套基于模型融合的信贷风控预警系统。首先,利用统计学方法预处理贷款违约数据。为了更好地挖掘数据集中违约样本的潜在信息及减少不同类别样本间的不平衡度,将孤立森林(Isolated Forest)算法改进后与SMOTE(Synthetic Minority Oversampling Technique)方法相结合,提出了一种新的过采样算法Isfr-SMOTE。该算法通过对违约样本评分来衡量样本相似度,避免了直接使用特征数值来度量样本间的距离,并结合特征实际含义与违约样本自身特点修正了该算法。经预处理方法得到了适用于建模的样本数据,并利用机器学习和深度学习方法构建了信贷违约预测基础模型,以验证Isfr-SMOTE算法的有效性。其次,考虑到上述基础模型对坏样本数量过分低估,造成模型性能不足,结合信贷评估场景下机构资金池饱和度不同影响信贷员误判的实际情况,改进并构建了自定义Focal Loss 的 LightGBM 模型、改进 GHM(Gradient Harmonizing Mechanism)Loss 的DNN(Deep Neural Networks)模型、针对不同客群设定损失权重的DNN模型以及低维嵌入表征样本的Siamese Network模型。通过设计模型融合方案,利用上述LightGBM模型和改进GHM Loss的DNN模型预测样本的违约概率,然后将设定客群损失权重的DNN模型和Siamese Network模型分别用于修正上述被高估的样本违约概率、丰富本层输出所包含的原始特征信息,实现了将这4个侧重点不同的改进模型部署到集成框架中融合成一个综合模型,并添加概率校准方法使得最终的信贷违约预测模型输出接近样本的真实违约概率。最后,设计并开发了信贷风控预警系统。将信贷违约预测模型部署到该系统中,并针对系统需求中“样本违约率变化趋势量化”功能设计了具体的实现方案,完成了违约风险趋势预警的量化分析。系统采用Client/Server模式的应用架构,从服务器端数据库读取待审核的贷款申请信息,并执行相应的业务逻辑功能,将信贷风险评估结果和违约概率变化趋势量化结果展示在客户端界面上,辅助信贷员在审批决策时准确控制信贷风险、预警客户高违约概率,通过样本测试数据证明了本系统的高效性与可行性。
其他文献
人口作为我国社会发展的重要基础与核心要素,对生产、投资和消费等领域有着重要影响。然而,受到政策环境、公共卫生和医疗条件等因素的影响,我国社会生育率持续下降、居民预期寿命不断延长,导致目前人口年龄结构的问题较为突出。人口老龄化必然要使得我国在经济社会发展的过程中面临一系列挑战。由人口老龄化造成的消费结构改变亦是不容忽视的。从居民个体层面出发,年龄的增长导致了本身的偏好发生了变化;拓展到社会总体层面,
学位
研究背景肠易激综合征(Irritable Bowel Syndrome,IBS)是一种临床常见的功能性的肠病,主要表现为腹痛发作频繁,并伴有排便次数、性状异常或排便习惯的改变,在诊断前病史6个月以上,且近3个月症状持续存在。依据RomeⅣ标准,根据粪便性状差异将肠易激综合征进一步分为4个亚型:IBS便秘型,IBS腹泻型(Diarrhea-type Irritable Bowel Syndrome,
学位
着力构建优质均衡的基本公共教育服务体系,是新发展阶段实现基本公共教育服务均等化的核心任务,需要从理论上认清其政策意义和时代内涵。基于历史比较、逻辑辨证和政策分析提出,优质均衡的基本公共教育服务在价值旨向上,应在强化公共资源投入和保障、提高服务能力和水平的同时,以促进人的身心成长和全面发展作为根本目的和落脚点,实现“服务性”和“教育性”兼重融合;在目标进路上,以“优质”和“均衡”作为核心分别互构生成
期刊
装配式建筑以其构件工业化、设计一体化、施工装配化等特点而受到广泛关注,我国的装配式领域的发展已经趋于健全,EPC总承包是目前大型项目中常见的管理模式,具有十分明显的优势。考虑到我国幅员辽阔,不同地区的气候特征各异,寒冷地区的建筑施工管理面临进度、质量、安全、成本等各种问题。因此,本文将EPC总承包模式与装配式建筑相结合,基于寒冷地区的气候特征,为现阶段装配式建筑在我国的应用提供了理论依据及改进意见
学位
近几年,新型冠状病毒肺炎(COVID-19)成为了全世界感染最严重的流行病,人类可能长期与其病毒共存。新冠病毒因其强大的传染力,使各个国家的医疗系统面临着强大考验。传统的核酸检测结果需要等待一定的时间,而肺部影像的人工诊断过于依赖专业知识,在面临严重的疑似患者时,则需快速诊断从而能够得到及时治疗。DR系统中的平板探测器在接收X射线后提供了肺部有效的图像特征,医护人员可以从图像上判断肺部的感染情况。
学位
<正>“幼有所育,优在善育。”学前教育关系儿童健康成长和未来发展,是构建高质量教育体系的重要组成部分。党的十八大以来,上海落实“幼有所育”决策部署,促进学前教育内涵发展和质量持续优化,走出了一条科学优质的学前教育十年发展之路,成为上海教育现代化发展中的一张名片。坚持儿童发展为本是根本遵循。从《上海中长期教育改革和发展规划纲要(2010~2020年)》提出“学前教育:为儿童健康、幸福成长实施快乐的启
期刊
<正>垂直阵列碳纳米管由于具有长径比大、分散性好、纯度高等优异的性质正日益受到碳纳米管研究者的重视,这其中重要的研究方向是如何低成本的批量制备并能够实现其真正的应用。这里我们提出了两种能够实现阵列碳纳米管批量制备的方法:阵列碳纳米管球面生长法及层状化合物通过浸
会议
《普通高中地理课程标准(2017版)》明确提出地理四大核心素养,将地理实践力作为四大核心素养之一,明确要求注重学生地理实践力素养的培养。基于新课标制定的课程方案需体现新课标对核心素养的培养要求。研究性学习作为一门综合实践课程,以地理实践活动为方式、研究为导向,对学生地理实践力培养具有重要作用。本论文基于建构主义理论、多元智能理论、最近发展区理论,运用文献分析法、问卷调查法、统计分析法和实践教学相结
学位
近几年,国内电信网络诈骗犯罪活动猖獗,发案态势逐年上升,给社会安定带来了极大威胁。电话诈骗是其中常见的一种形式,是指诈骗分子通过电话骗取受害人钱财的犯罪活动,尤其在老年人群体中,电话诈骗占据相当高的比重,如何有效治理电话诈骗,是运营商面临的一大挑战。当前,自然语言处理(Natural Language Processing,NLP)技术正处于快速发展阶段,NLP任务可以划分为四大类,包括:序列标注
学位
目的:为了了解白癜风患者临床特征、中医证型、体质的分布情况,探讨其中医证型与体质之间的联系,探究其临床特征与中医证型、体质之间的相关性,旨在为临床白癜风诊疗提供一定的参考意义。方法:本调查研究选取自2020年10月至2022年2月期间于天津市中医药研究院附属医院皮肤科门诊就诊的符合病例纳排标准的156例白癜风患者,通过较为详细的问卷调查获得包括临床特征、中医证型、体质分布情况等临床病例数据,将其录
学位