基于机器学习算法的互联网金融风控模型研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:liongliong599
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网金融行业随着IT技术的发展快速崛起。2017年国内估值超过10亿美金的独角兽企业中,互联网金融行业数量排在第二,并以超过七千亿人民币的总估值排在各行业的首位,整个互联网金融行业炙手可热。仅仅一年不到,2018年互联网金融企业出现集体“暴雷”,仅仅在7月一个月内,就有130多家互联网金融企业陆续倒闭。在持续“暴雷”的现状下,互联网金融行业的发展举步维艰,同时也让人们对互联网金融的认识回归理性。互联网金融行业的发展不是靠投机,靠高收益,而是为人们的生活带来便利。互联网金融在支付领域的发展正是得益于提升了人们的支付效率,通过二维码支付、芯片卡支付等技术为人们的生活带来便捷,这才是互联网金融所应当承载的核心价值。借贷业务是互联网金融行业的核心业务,如何让互联网的新技术去优化传统金融的运行逻辑,更好地把控借贷风险,让需要资金且具备还款能力的用户更加便捷的得到借款,使得资金更加高效合理地被利用,是当务之急。因此,本文旨在运用机器学习技术构建有效的风控模型,从而帮助互联网金融企业更好地把控借贷风险。其中主要的研究工作有:第一,从多个维度提取互联网金融平台借款用户的样本数据,其中包括用户的消费数据、运营商数据、同盾等第三方提供的用户相关数据,然后对数据进行进一步处理,通过特征工程提取用于构建模型的数据。第二,针对经典的机器学习算法(逻辑回归、支持向量机和决策树)和集成学习算法(随机森林和lightGBM),分别构建风控模型,并对模型进行调优。第三,从构建的风控模型中挑选出性能比较好的逻辑回归模型、线性支持向量机模型、随机森林模型和lightGBM进行Stacking融合,进一步提升模型性能。第四,对用不同类型的机器学习算法和用不同方式构建的风控模型进行比较,了解其性能差异,同时找到性能最好的风控模型。本文通过研究不同类型的机器学习算法在互联网金融风控模型上的应用,为互联网金融风控模型的构建提供了方法,从而帮助互联网金融企业更好地把控借贷风险,同时,也为模型算法的选择提供了思路。此外,本文通过模型融合的方式进一步提升了风控模型的性能,为模型的性能改善提供了指引和借鉴。
其他文献
渤海湾盆地东营凹陷古近系沙河街组四段垂向上发育3套膏盐岩,膏盐韵律层具有明显的蒸发成因的沉积序列。膏岩层在平面上呈环状分布,从湖盆中心向盆地边缘依次沉积盐岩-石膏-
从古至今,水都是人类耐以生存的重要元素,而且人类具有与生俱来的亲水性。城市滨水公共开放空间是整个城市的形象窗口,也是城市中人气聚集的重要休闲场所。重庆由于其独特的
东濮凹陷北部老第三纪时期发育了巨厚的盐岩沉积 ,构成了盐滑脱变形构造发育的物质基础。持续的拉伸应力作用 ,导致盐层上覆盖层差异沉降形成伸展型强制性褶皱。同时 ,由于盐
以"勘探反演"的思路,总结了近年来膏盐岩下油气勘探研究的现状,分析了膏盐岩盖层的分布特点,讨论了我国膏盐岩下海相地层的勘探潜力与方向。研究认为,膏盐岩是优质盖层,在我
肺切除术是非小细胞肺癌首选的治疗措施,其中微创肺癌根治术以其创伤小、恢复快的优点逐渐成为一线城市及中心城市胸外科的主流手术方式[1-2]。但胸外科手术难免对肺组织会产
受饮食文化的影响,广州市饮食消费市场异常活跃、特色鲜明。要传承和光大广州饮食文化、进一步繁荣和发展广州市饮食消费市场,有关部门必须制订长远发展目标。要以饮食文化为
全国社保基金,作为国家的储备基金,在2006年颁行《全国社会保障基金境外投资管理暂行规定》后,正式启动了社保基金投资境外。社保基金投资广阔的世界经济市场,不再因为投资渠道的
荒漠肉苁蓉(Cistanche deserticola Y. C. Ma)为专性根寄生植物,寄主为梭梭(Haloxylon ammodendron(C.A.Mey.)Bunge)。自然条件下,种子萌发率很低。本研究从形态特征与种子萌
基于图像序列的运动目标检测与跟踪是计算机视觉领域的重要研究课题之一,这一技术在军事、医学和科研等领域都具有广阔的应用前景。运动目标检测与跟踪算法的设计直接影响跟踪
渤海湾盆地黄骅坳陷奥陶系潜山可划分为3种类型:1)翘倾断块潜山,是在喜山期扭张运动中发育的翘倾断块,其形成与伸展作用有关,如徐黑、北大港和南大港潜山等;2)层滑冲断潜山,