论文部分内容阅读
复杂网络是真实世界中系统的另一种表达方式,具有一些基本的统计特性。对复杂网络的研究可以使人们对真实系统有更加深入的了解与掌握,具有巨大的理论意义与现实价值。节点影响力排序可用以分析网络中各个节点影响力大小,确定网络中的核心节点,通过核心节点去影响和改变其他节点的行为等。社区发现可用于分析复杂网络的拓扑结构,有助于人们对复杂网络的组成和隐藏规律的了解。本文基于数据挖掘理论和方法,针对手机通话网络中节点影响力排序及社区发现两大问题进行研究,主要工作如下:1)讨论了节点影响力排序和社区挖掘的目的及意义,综述了节点影响力排序和社区挖掘的主要方法及研究现状。2)以PageRank算法为基础,提出了 PhonePageRank算法度量手机通话网络中的节点影响力,并通过问卷调查的方式统计了某课题组半年内的通话数据,用PhonePageRank算法对该数据网络进行影响力分析,证明该算法的有效性。3)在标签传播算法LPA的基础上提出了基于PhonePageRank的标签传播算法PPRLPA算法。算法以节点的PhonePageRank值为基础,选出一定规模的具有较高影响力的种子节点赋予标签,通过种子节点进行标签传播,在某课题组的通话网络及其他真实数据集上进行测试,验证了算法的有效性。4)以某公司实际需求为背景,以手机通话网络数据挖掘算法为核心,完成了“手机信息线索链分析系统”的需求分析、系统设计和系统开发。系统前台采用Windows Form组件,数据库采用SqlServer2008,后台代码采用MVP框架分离界面显示、功能逻辑以及数据模型。系统可为用户提供数据建立、数据分析、基础数据和系统管理四个模块的功能。仿真测试结果表明,系统具有很好的挖掘效果和很高的运算效率,可以满足用户的现实需求。