论文部分内容阅读
随着全球恐怖组织势力不断壮大,全世界大部分地区都笼罩在恐怖主义阴影之下。恐怖组织攻城略地,肆意发动爆炸袭击,严重影响到人类正常生活与公共安全,其残暴行径为全世界所有爱好和平的人士所不齿,反恐斗争已经成为一项艰巨且迫在眉睫的任务。然而,以数据驱动方式对恐怖组织行为进行挖掘与预测的相关研究相对较少,而且已有的恐怖组织袭击预测算法或者预测准确率偏低,或者时间复杂度过高而不适用。本文立足于全球恐怖组织数据库GTD (马里兰大学研究人员精心收集与编排的记载了从1970年到2014年的历次恐怖袭击数据库),主要研究了恐怖组织数据库中缺失行为数据问题和恐怖组织行为预测问题,主要工作分为以下三个部分:第一,梳理了恐怖组织行为挖掘与预测的相关研究。对数据挖掘在反恐中的应用与基于数据挖掘的反恐流程进行了概括总结,对现有的恐怖组织行为预测算法进行了详细的阐明和算法分析,对本文涉及到的关联规则算法进行了概念介绍,对常用的恐怖袭击数据库进行了简要介绍。第二,构建了对恐怖袭击数据库中缺失武器数据挖掘的混合分类器,且该混合模型以朴素贝叶斯、KNN和ID3为基础模型。实验表明,通过互信息特征和随机特征进行比较,互信息特征在模型准确率上是随机特征的五倍。模型融合也比单模型有更高的预测准确率,且对武器信息预测平均F1值高达0.645。第三,构建了时序逻辑行为的有权值规则挖掘模型并提出LBT_ Weight算法。该模型将恐怖组织行为预测问题看待为NP问题,以关联规则算法思想挖掘恐怖组织行为频繁模式。通过一系列对比实验,得到一个滑动时间窗口大小为7天、滑动步长为1天、以指数函数作为衰减函数、衰减因子α= 0.22的最佳模型。LBT_ Weight算法与现有的Convexk_NN算法对比,其预测准确率比Convexk_NN高1.48%。