论文部分内容阅读
我国大规模地普及移动电话和智能终端产生了海量的移动用户历史数据,其中通话记录能够反映移动用户在真实世界中的社会关系,在网络里用户的社交圈被称为社区,通过分析通话记录发现移动用户可能处于不同的社区,比如有亲友社区、工作社区和爱好社区,不同的社区有不同的特征,这些特征被称为社区画像。本文根据通话记录数据重点研究两个问题,一是如何发现通话记录中的社区,二是如何为发现的社区构建画像。针对第一个问题,提出了基于边权重的模块度评测指标,和基于邻集边的局部社区发现算法。针对第二个问题,提出了构建通话记录网络局部社区画像的方法,另外为了从多角度了解用户的通话特征和习惯,本文还提出了从多角度构建局部社区画像的框架。在公开数据集和通话记录网络上的测试结果验证了本文提出的局部社区发现算法的有效性,具体结果如下:(1)对有标签网络,该算法能够发现比较完整的真实社区;(2)对无标签网络,该算法发现的局部社区具有较高的模块度。在通话记录网络上的测试结果表明,本文提出的多角度构建局部社区画像框架能够有效地刻画用户的通话习惯和个人偏好。