基于复杂网络理论和通话记录的用户行为异常识别研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:wenjun_wu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动电话的普及,移动电话已经成为人们日常生活中必不可少的工具之一,正是由于其使用的广泛性,使得移动通话记录成为最能反映一个人日常行为的载体,通过对移动通话记录的挖掘,能发现许许多多有用的信息。相比于传统的QQ聊天记录、微博转发记录,移动通话记录能够从时间、空间等多个维度进行分析,分析得到的结果更具有代表性。通过移动通话记录来进行用户通话行为异常识别的研究,可以发现潜在的异常用户,为社会的反恐,维稳提供重要的信息。   本文利用中国移动手机用户在几个小区中为期3个月的通话话单来进行研究,主要介绍了利用复杂网络特征来构建MCG网通话行为特征库、模糊决策树算法、以及特定人员未知号码的识别技术。重点介绍了如何选择构造MCG网的特征库和利用模糊决策树算法来对用户通话行为是否异常进行识别。在构建模糊决策算法的过程中,详细分析了PN、IN、Gain参数对模糊决策树性能的影响,在进行分析比较的基础上,得出了最优的参数。实验结果表明,经过参数选择之后生成的模糊决策树,针对用户通话行为异常的识别,能够减少模糊决策树的层数和叶子节点的个数,达到较高的准确率。   用户通话行为异常识别,是一种采用模式识别的方法,通过对移动通话的话单记录进行分析,在提取通话记录特征库的基础上,采用一种合适的算法来对通话行为数据进行挖掘,并给出识别结果。常用的算法包括朴素贝叶斯算法,人工神经网络和决策树算法,通过分析各种算法的优缺点,发现模糊决策树算法由于采用了模糊理论,在对结果的表示上不是给出清晰的结论,而是通过隶属度来区分,能够非常好的接近人的思维,因此,得出的结果更为可靠。   为了提高识别的准确率,在实验的过程中采用十折交叉验证,通过增加实验次数,可以有效的降低实验误差。实验结果表明,和简单的把实验数据划分为训练集和测试集的方法相比,十折交叉验证方法有效的提高了实验结果的准确率。
其他文献
随着互联网与信息技术的发展,各行业的数据量都在迅猛增加。在高速增长的数据与传统的数据分析方法之间矛盾的刺激下,数据挖掘技术应运而生了。关联规则挖掘算法能够发现交易数
自由空间光通信是指以光波为载体的无线通信技术,具有通信容量大、功耗低、抗电磁干扰和无需频率使用许可等优点,特别是在大气/海水激光通信这一典型的跨介质通信应用场合中,以
超宽带无线技术具有高速率、低功耗、抗多径衰落效应和低误码等优点。它被广泛应用在雷达、定位、电子对抗以及保密通信等领域,军事通信及民用通信的发展也离不开它。微带天线
电动机作为一种动力装置在工业农业生产中有着举足轻重的地位,但是由于工作环境等因素电动机很容易出现故障,没有及时处理就会引起很大损失,为了提高工作效率以及减少不必要的损失,对电动机进行保护就有着很大的意义。本文根据电动机运行特性的数学模型,利用MATLAB/SIMULINK建立了仿真模型,通过仿真模型分析了电动机的起动特性以及运行特性。电动机有很多常见故障如堵转、短路、热过载。本文主要对电动机的起动
无线传感器网络(Wireless Sensor Networks)是由部署在监测区域内大量的传感器节点,通过无线通信方式形成的一个多跳自组织网络系统。目前,无线传感器网络主要应用在军事、环境
在互联网发展日新月异的今天,新技术的出现层出不穷。由于P2P技术具有内容分发的高效性与系统的高扩展性,P2P应用在互联网中迅猛发展,涌现出许许多多基于P2P的新应用,如即时讯息
随着互联网的快速发展和网络应用的不断涌现,各种数据呈指数模式增长。面对海量的数据,如何快速安全地将其分发到众多的网络用户引起人们的研究。P2P网络作为分布式网络,突破传
正交频分复用(OFDM)技术是一项重要的调制技术,由于可以在无线环境下有效克服多径衰落的影响,并且具有较高的频率利用率,长期以来在通信领域有着非常重要的地位。目前,OFDM技术已
随着系统仿真技术应用领域的不断扩宽,计算机仿真需要解决的问题越来越复杂。世界各国在原有单一协同仿真技术不能满足其需求的情况下,开始深入地研究HLA技术用于复杂产品间
近年来,随着电子信息技术的迅猛发展以及互联网技术的日渐普及,数字技术和网络技术也越来越普遍应用于人们的日常生活和工作之中。虽然网络化与数字化的信息时代给我们带来了