论文部分内容阅读
在2019年我国推行了进一步落实全面取消二手车限迁的政策,这无疑给迅速发展的二手车行业又带来了新的增长点。随着二手车市场规模的扩大,对汽车金融贷款的风险控制能力又提出了新的要求。而互联网汽车厂商的金融服务本身就有着低于传统金融的准入门槛以及较快的贷款审批效率,采用传统的评分卡模式的审批模型已经不能满足新场景下的风险控制要求。因此建立一个能够快速迭代的贷前审批风险控制模型,对互联网汽车金融行业有着很重要的现实意义。为了解决现有的评分卡模型迭代成本过高的问题,本文与A互联网汽车销售公司合作,基于长短期记忆神经网络设计并实现了可以应用于二手车行业的贷前审批风险控制模型。本文的主要研究内容包括金融内外部数据的预处理及循环神经网络的结构设计两部分。金融数据预处理主要为了解决数据的缺失问题及数据的非平衡性问题。针对数据缺失问题,采用线性函数归一化的方法来对数据进行删除或增补。针对数据非平衡性问题,利用Border-line SMOTE算法来生成采样器,对修复缺失值后的数据重新采样,在数据层面修复非平衡问题。在深入了解各种机器学习及深度神经网络的特点后,本文基于长短期记忆神经网络搭建了一个综合性能较好的深度神经网络模型。该模型不同于现有的依赖统计学习的评分卡模型,不仅进一步的降低了对金融专家的依赖,而且具备快速迭代的能力。基于A公司金融订单相关数据集,将本文提出的模型同传统的机器学习模型(XGBoost模型等)进行对比。结果表明,本文的金融数据处理方法在XGBoost等机器学习模型的评价指标上都有了3%左右的提升;本文提出的基于长短期记忆深度网络模型的AUC值和KS值均稍高于XGBoost模型,而且和XGBoost模型相比,具有调参成本低,迭代方便等优点,综合来看,本文提出的模型在经过一段时间的线上并行校验后可以替代XGBoost作为新一代的金融风险控制模型方案。