论文部分内容阅读
随着移动互联网的发展,以人工智能和区块链技术为代表的金融科技深刻影响着我们每个人的消费行为,甚至改变了传统金融业的发展模式。于此同时,风险也以更快的速度、更多元的维度传递着。充分挖掘金融科技的潜力,建立有效的风控系统,提升金融风控的能力和效率,是金融科技在新时期持续发展的必然要求。现代技术,尤其是机器学习方面的创新,已经被应用于分析客户的消费模式和阻止不定期或可能欺诈的交易。统计数据表明,信用卡交易数据存在极度倾斜不平衡的问题,欺诈样本的数量远远少于正常样本的数量。此外由于金融交易信息与客户数据高度保密的关系,各个银行使用的数据都被认为是非常敏感的。一方面因为数据倾斜问题,欺诈检测系统很难了解欺诈的模式,也很难去检测侦察他们。另一方面因为隐私问题,欺诈检测的一些机器学习模型通常只使用每个银行单独收集的内部数据,这种模式使得大规模协作研究变得困难。本文提出一种基于联邦学习的带隐私保护的信用卡欺诈检测方法和系统。与传统的欺诈检测系统把数据集中在数据中心训练的方式不同,本文提出的联合欺诈检测系统首先运用一种过采样方法来平衡倾斜的数据集,然后利用分布在各银行的本地数据库中的数据来训练欺诈检测模型,最后通过聚合参与进联邦学习的客户端的底层欺诈检测模型的参数或者模型的参数更新来构建全局共享欺诈检测系统。使得银行可以在不上传私有数据集的情况下从全局共享模型获益,并维护了银行的数据安全,保护了银行用户数据的隐私。本文在大规模的公开信用卡交易数据集上评估了该联合欺诈检测系统的性能,实验结果中联合欺诈检测系统的平均测试AUC达到了95.5%,比传统欺诈检测系统高出约10%,证明了该系统性能的优越性。