论文部分内容阅读
随着互联网的不断发展,智能手机、平板电脑等智能终端在人类生活中的普及以及移动网络带宽的不断提高,使得微信、微博等社交媒体已经渐渐成为了人类生活中不可或缺的部分。人们在真实世界中的互动与联系,也不断的向互联网上拓展,使得我们的社会也被社会化了。作为一种社会学理论、信息处理及电子商务等多个学科的交叉热点,大规模社会网络应运而生。大规模社会网络中,每天产生的海量信息数据具有很高的价值。对这些数据的发掘和分析成为研究大规模社会网络的重要途径。通过对大规模社会网络数据的分析和有效信息的发掘,能够更好的理解大规模社会网络,为进一步的舆情监控、电子商务个性化推荐等实际应用的研究提供了理论基础。目前,社会网络的研究已经逐渐从对中小规模的在线社会网络结构研究,进入到了大规模社会网络结构的研究中。同时,研究的目标也从发现指定单一结构方面向多结构发现方向转变。大规模社会网络结构多样化研究已经成为了当前社会网络结构研究的热点和重点。然而,现有的研究,往往从特定的结构研究出发,没有考虑到多种结构相互配合,能够更好的反应出大规模社会网络结构的特点。基于以上的考虑,本文针对大规模社会网络的结构问题进行了研究,提出了新的概念及相关定义与实现算法。本文的贡献主要有以下几方面:首先,在大规模社会网络结构研究的传统定义上,充分考虑了多种结构在大规模社会网络结构分析的重要性,提出了关键结构概念。同时分别给出了关键结构概念的一般化定义。并依照关键结构的定义,说明了关键结构的发现过程,提出了关键结构的评价标准。其次,给出了结构洞节点的描述性定义,分别介绍了用于发现关键结构的随机块模型SBM(Stochastic Block Model)及结构洞节点发现方法SHSD(Structural Hole Spanners Detection)。最后,使用名为BC的博客数据集和名为MB的微博数据集为实验数据集,进行相关实验。实验结果表明,随机块模型能够发现社会网络中的社区结构,且在分类结果上使用结构洞发现方法SHSD能够发现网络中的结构洞节点。通过与原始输入网络数据图进行比较,实验发现的关键结构能够较为全面的描述整个社会网络的结构特征。