基于特征工程与多模型融合的互联网金融违约预测系统

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:man168176
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,互联网金融已经是当今社会金融发展的趋势,随着人工智能等技术不断渗透,依靠金融科技主动收集、分析、整理各类金融数据,为细分人群提供更为精准的风控服务,成为解决互联网金融风控问题的有效途径。应用人工智能和大数据等技术对互联网金融用户违约预测,为金融商家提供用户更全面的了解和评估,构建机器学习算法是违约用户预测成功的关键,但是目前研究众多风控模型中,对于金融违约用户预测还存在许多不足之处。本文的主要研究内容如下:1.为提升预测效果,丰富数据信息量,进行数据预处理和特征构建。本文对原始数据进行缺失值处理、时间处理、信息冗余处理后进行数据划分,构建大量特征,并按照特征类型进行特征分群。通过实验分析,验证评估各个特征群的有效性,为特征工程提供广泛思路,对比分析多种特征选择方案,寻找到适合金融场景下用户违约预测特征选择方案。2.为进一步提高互联网金融用户违约预测算法预测效果,进行参数调优、多模型构建与融合。参数对模型扰动大且单模型不具有稳定性,通过参数调优寻找较优参数组合减少参数对模型扰动,构建XGBoost、Cat Boost、GBDT、Light GBM、Random Forest多个单模型,多模型融合发挥各单模型优势,提高用户违约预测算法泛化性能和预测效果。3.以上述特征工程和参数调优、多模型构建与融合方法为核心,设计和实现互联网金融用户违约预测系统,协助企业管理者科学预测。本文数据来源于2018年马上AI全球挑战者大赛用户违约预测提供了2016年4月至2017年4月用户真实贷款消费行为数据,评价指标为用户违约预测AUC(AUC值即ROC曲线下面积,模型越精确AUC值越大)。本文通过数据预处理、特征构建与选择、参数调优将AUC值提升为0.8267,通过多模型融合,预测效果显著,AUC值进一步提升到0.8293。在马上AI全球挑战者大赛用户违约预测AUC值排行榜的1222支队伍排名第一。本文基于上述核心方法,设计并实现互联网金融用户违约预测系统,为金融领域提供更为精准的风控服务。
其他文献
自高熵合金这一概念被提出以来,由于其简单的相结构和各方面优异的性能迅速成为国内外学者的研究热点。成分设计、陶瓷相的添加、挤压、轧制以及热处理等常被用于传统合金的
非晶合金在很多性能方面表现出明显的优势,具有成为重要工程材料的潜力,但由于室温的塑性较差,也严重的影响了其实际的应用。弛豫是过冷液体和非晶中固有的普遍特征,对于理解
我国文化贸易发展火热,但是在出口规模不断扩大的过程中依旧存在着诸多问题,我们需要提高产品的国际竞争力。另一方面,跨文化传播在推动文化贸易全球发展的过程中起到了重要
Haldane模型作为简单的量子反常霍尔效应模型被大量研究,尤其是在石墨烯晶格结构上采用不同的几何构型来展现新的物理。作为陈绝缘体,我们在数值上研究它的方法局限于能带图,
城市居民的自发性建造活动和城市社区的发展紧密联系,密不可分。如今,随着国家经济实力的提升,城市人口数量也逐年增加,城市社区的面积也扩大了。然而,一方面由于强调建宏观设效率的施工模式忽略了微观上使用者的日常生活习惯,另一方面也由于城市居民生活方式日新月异,导致原有的社区空间并不能很好地满足实际居民的使用需要,社区出现了居民的自发性建造行为。传统观点认为,社区自发性建造活动是城市改造中需要重点整治的对
学位
铝合金作为密度低、强度较高、塑性好、且具有优良导热和抗蚀性的轻质合金,广泛应用在航天、船舶、汽车和铁路运输等领域中。然而热裂是铝合金熔铸过程中常见的一种缺陷,铝铜
随着社会的快速发展,当今社会已进入知识经济时代,人力资本已取代传统生产要素成为当今社会最重要的生产要素,深刻地影响着不同国家和地区的知识经济发展水平。人力资源对一
镍基高温合金综合性能优良,被广泛地用于制作可以承受住在高温、高速、反复启停等苛刻工作环境中还可以进行长时间和稳定地工作的高温部件,比如说航空发动机、燃汽轮机中的一
玻色和爱因斯坦预言的多粒子集体相干而自发占据基态的玻色—爱因斯坦凝聚(BEC)态,首次由JILA小组于1995年利用磁光阱技术在超低温170nk的87Rb蒸汽中实现。但超低温实验要求
本试验以湘波绿2号、槠叶齐和白毫早3个品种不同花期茶树花为材料,采用气相色谱-质谱法、分光光度法、高效液相色谱法及顶空固相微萃取法,检测了茶树花水浸出物、可溶性糖、