论文部分内容阅读
微博客,简称微博,是一种通过关注机制分享简短实时信息的广播式的社交网络平台。微博中的用户是通过关注机制形成联系,进行信息分享与交流,而随着长时间的发展积累,微博用户以及他们之间的关注关系共同组成的了一个复杂的社会网络系统,即微博网络。在微博网络在形成过程中,部分微博用户会逐步形成一种小团体结构。微博网络中的小团体结构是社会网络中的一种的社区现象,如果能够挖掘到具有相同或相似兴趣爱好的小团体,就能更好的帮助微博用户选择关注对象。近年来,学者们对微博网络中的社区结构进行了深入的研究,但结果并非尽善尽美。本文为了对真实的微博网络进行社区发现研究,在有向图的基础上提出了紧密度矩阵的概念,刻画了用户间关系的紧密程度。采用了一种基于广度优先搜索思想的社区发现方法,该方法分析了网络中的全局结构,具有较高的准确率。但该算法存在着无法判断网络中社区结构好坏的缺点,因此将该算法与一种新的模块度测量方法相结合,将其改进并用于社会网络的社区发现研究。基于微博网络的实际情况,将紧密度矩阵的概念与基于广度优先搜索思想和模块度测量方法相结合,提出了一种基于广度优先搜索和模块度的社区发现算法,应用在微博网络的社区发现研究。最后论文采用了Java语言进行了算法的实现了基于广度优先搜索和模块度的社区发现算法并应用于Zachary空手道俱乐部的网络中,验证了其有效性及准确性,而后本文选择了通过公开采集与抽取从新浪微博中获得NLPIR微博关注关系语料库,生成一个真实微博网络,采用基于广度优先搜索和模块度的社区发现算法进行了微博网络进行了社区发现研究。