论文部分内容阅读
近年来,随着全国经济的高速发展,经济犯罪现象频发,犯罪类型屡屡增加,涉及洗钱犯罪的可疑交易数量也与日俱增,中国人民银行每年接受的反洗钱可疑交易报告也越来越多,打击洗钱犯罪行为的工作迫在眉睫。而随着互联网时代的到来,犯罪行为也和互联网越来越密切,面临着犯罪手段多样化,犯罪隐蔽性高的特点,洗钱案件的侦查工作也更加困难。在金融领域,反洗钱得到了深入的研究,并形成了一系列理论,但反洗钱领域的研究方法都是从商业银行的角度出发,大多是针对可疑交易的识别,异常账户的识别等。如果将金融领域的分析理论和方法直接用于公安案件侦查中,实际的效果并不理想,因此本文从公安侦查的角度,结合洗钱交易数据量大,交易金额高等特点,提出几种反洗钱算法,用于协助洗钱可疑交易的案件分析。本文的主要工作和创新可以概括为以下四点:第一、洗钱资金流向宏观角色分层分析。由于洗钱数据量大,交易行为复杂,很难直观的从海量数据中寻找出各个账户的大体角色,本文设计了一种洗钱资金分层模型,根据账户的资金流动方向对账户划分层次,并将大规模数据简化,将账户划分为资金汇入层,中间流转层和资金变现层,从宏观上展示账户在洗钱网络中的交易角色。第二、分层数据可视化自动布局。针对分层后的资金数据,设计了受限力导向自动化布局算法,能够通过自动布局将分层后账户间的层次关系以可视化的方式展示出来,解决了数据量大的情况下无法人工布局的问题。在算法的实现过程中,由于节点的初始布局对最终自动布局的效果影响较大,本文选用遗传算法确定各层账户的初始布局,优化各层连接的边的交叉情况,然后将各个节点压缩在每一层,使得每个节点只能在水平方向上移动,再模拟弹簧的原理,根据每个节点受到其他节点的引力和斥力的作用来实现自动布局,直到最终达到稳定状态。分层数据的可视化布局能够清晰地展示出数百万甚至千万级交易流水数据中账户的宏观角色,包括负责资金来源的资金汇入层账户,负责相互周转资金的中间流转层账户,以及负责变现和沉淀资金的终端变现层账户。第三、洗钱团伙发现。根据公安部门的实际侦查结果,洗钱犯罪往往呈现出团伙特征,但是在案件侦查中遇到的都是海量资金交易数据,无法人工划分出团伙,而洗钱案件中团伙成员在资金往来上又必然会有高度的联系,因此本文设计了基于网络表示学习的团伙划分算法,能够从资金交易数据中自动地划分出团伙。先使用表示学习算法学习账户的向量特征,然后再对向量特征进行聚类来形成团伙。同时,相较于传统的团伙发现算法忽略洗钱资金的有向性,只根据账户之间的交易关系来划分团伙,不考虑交易中的金额,次数,以及其他重要的交易属性等特点,本文团伙划分算法结合了交易次数,交易金额,介数中心度等属性,使用模块度对划分的团伙进行评价,模块度的值大约为0.66,取得了不错的效果。第四、洗钱可疑交易模式匹配。为了详细分析团伙成员账户的可疑交易情况,需要针对账户匹配一些常见的洗钱可疑交易模式。传统的模式匹配算法有计算量大,容错性低等局限性,本文提出基于半监督的网络表示学习的交易模式匹配算法,先构建固定的可疑交易模式的数据集作为有监督数据集,然后处理未知模式的洗钱可疑数据集,将两者整合为图数据放入基于结构相似度的网络表示学习算法中训练,通过计算固定可疑交易模式节点和洗钱数据节点的结构相似度进而匹配账户的可疑洗钱交易模式。将本文提出的算法应用到2018年公安部的实际案件中,都取得了一定的效果,在仅有资金交易数据的情况下,协助公安机关找出洗钱数据中各个账户的主要角色,划分出了可疑的洗钱团伙,发现了团伙成员各个账户的可疑交易行为模式,为案件侦查提供了重要线索。