【摘 要】
:
互联网金融给人们的生活带来了极大的便利,在方便信用卡贷款同时也带来了贷款违约的风险隐患。因此了解违约用户的行为特征是降低信贷平台金融风险的关键。本文就用户贷款违约问题构建了二分类模型对用户是否会发生贷款违约行为作出判断,具体工作成果总结为以下几点:(1)特征工程和探索性分析。本文首先对原始数据进行预处理,填补了缺失值并删除异常值,从而获得完整数据集。接下来构建特征工程,人工衍生出具有实际意义的10
论文部分内容阅读
互联网金融给人们的生活带来了极大的便利,在方便信用卡贷款同时也带来了贷款违约的风险隐患。因此了解违约用户的行为特征是降低信贷平台金融风险的关键。本文就用户贷款违约问题构建了二分类模型对用户是否会发生贷款违约行为作出判断,具体工作成果总结为以下几点:(1)特征工程和探索性分析。本文首先对原始数据进行预处理,填补了缺失值并删除异常值,从而获得完整数据集。接下来构建特征工程,人工衍生出具有实际意义的10个变量。然后是对变量的探索性分析,从直观上感知自变量与因变量的关联性,为模型的构建提供依据。(2)不平衡样本的处理。训练集中两类样本占比不均衡,为了防止不平衡样本对预测结果的误导性,对训练样本分别进行了欠采样与SMOTE采样,实验结果表明基于SMOTE采样法获得的平衡数据集的模型预测效果更好。(3)融合模型的构建。为了改进单一模型预测的不足之处,本文以xgboost,catboost和GBDT模型为基模型,构建了基于元模型为随机森林的融合模型Stacking。首先在平衡数据集上训练三个基分类器,并获得了对因变量的预测概率,以此为新特征组成新的训练集。在新的训练集上构建元模型,从而获得了最终的预测结果。实验结果也表明融合模型的预测更好,模型的AUC值为0.7252,准确率达到80.50%。
其他文献
随着互联网的发展,互联网+应运而生,数字阅读属于互联网下的产物,该方式能够满足读者在不同情境下的阅读需求,且阅读内容丰富多样。目前,数字阅读行业已经步入了全版权运营新时代,丰富多样的原创文学内容正在互联网的普及下进行广泛的传播,再通过深度地挖掘IP的衍生价值,出现了文学、漫画、影视等多个产业的融合。数字阅读行业用户规模的不断提高以及行业的不断发展使得数字阅读行业成为资本市场上新的投融资热门,投融资
股权质押以成本低、效率高、时间短、质押资金用途广泛的融资优势,成为我国民营企业比较青睐的融资方式。据统计,截止至2019年底,我国A股上市公司质押规模已达到5790亿股,我国股权质押市场整体呈平稳上升的趋势。2018年A股市场波动频繁股市连续跌破整数关口,多家企业遭受重组失败、股价大跌、股权质押爆仓的打击。为了避免退市并解决质押危机,40余家民营上市公司引入国有股权,其中有20余家甚至将控制权转手
新《证券法》压实了中介机构的法律责任,在IPO审计过程中,审计人员对于精准识别企业风险、规范企业财务行为、预防欺诈等有非常重要的意义,重大错报风险评估与应对,是IPO审计的核心所在,备受关注。与法律背景共同发展的是物业企业的市场背景,伴随着中国房地产市场的快速发展,多数大型物业公司依附关联方房企实现快速发展,并争相到二级市场渴望借助IPO为企业发展筹备足够的资金,确保公司能够实现长远发展。与此同时
定向增发已成为我国上市公司股权再融资的主要方式。市场时机选择理论的研究发现,上市公司在公司股价较高时,选择定向增发股票以募集更多的资金,是市场时机行为的体现。有关定向增发的股权再融资行为已经成为市场时机理论领域的重要研究对象。中国资本市场2017—2019年高业绩承诺导致的泡沫破裂现象也十分引人注目。现有文献的研究发现,公司为满足业绩承诺,会进行业绩操纵。目前,很少有学者用市场时机理论来解释业绩承
近年来,我国对科研发展投入逐步提高,据统计,我国2020年研究与试验发展经费支出共计24426亿元,同比增长10.3%。随着科研投入加大,我国对于科研质量管理的要求也在不断提升,“十三五”期间,国务院先后印发了多项政策意见,要求进一步推动政府部门科研管理“放、管、服”,一方面加强科研管理质量导向,另一方面逐步加大项目承接单位对科研项目的过程管理权,这对相关单位的科研管理水平提出了新的要求。高校和医
为了促进我国资本市场的平稳发展,切实保护投资者的利益,证监会在不断地致力于完善上市公司退市制度。2014年证监会发布《关于改革完善并严格实施上市公司退市制度的若干意见》,是在原有的退市制度基础上进一步细化。在此次《意见》中首次提及“主动退市”概念,随后沪深交易所相继修改其相关的制度规则。在此次完备后的退市制度的引导下,主动退市的上市公司数量有所增加,而且主动退市的方式也呈现多样化趋势。退市方式由原