论文部分内容阅读
经济全球化、市场化和开放性金融正不断深化,授信客户信用风险过高不仅会对银行产生潜在利益的损害,还会对自身偿还贷款产生影响。由此研究如何利用银行现有的数据资料,即海量客户金融交易数据,对信用风险的量化管理与预警是大有裨益的。本文将针对某商业银行系统中的核心交易数据——基于海量分布式的异构金融交易数据进行研究分析。在此基础上,基于Wreka开源平台设计并实现一套客户金融交易数据分析平台(Customer Financial Transaction Data Analysis Platform)。论文主要工作和贡献如下:1.分析了银行信贷管理相关的部分核心业务数据结构,调研银行信贷管理相关知识,总结了基于客户金融交易数据分析,客户信用风险的应用需求。2.优化了基于商业银行授信客户交易来预测客户还贷违约概率的模型。通过融合决策树算法与SVM算法进行联合寻优并构建模型,并对优化效果进行了测试和验证。3.基于WEKA技术平台,设计并实现了基于客户金融交易的数据分析平台。该平台要融合利用数据仓库、机器学习、支持向量机(SVM)等智能信息处理技术,构建一个可针对以金融交易为核心的海量业务数据,进而挖掘处理与综合分析的原型平台。该原型平台具有数据前处理(实现异构数据获取载入/浏览/预处理等)、各类核心算法实现模块、算法组合元描述语言脚本解释执行模块,和针对分析结果的图形化展示模块。本文具体负责了源数据管理、基本智能分析处理算法以及定制、执行数据处理模块的实现。该原型平台目前已基本实现,可正常执行。通过将平台应用于探索某省级商业银行客户海量金融交易数据,并处理信贷客户贷款违约概率预测问题,验证了平台系统的可用性。