论文部分内容阅读
互联网的诞生和发展带动了多种网络应用,以社交网络为代表的网站应用正将我们带入更加深入的web2.0时代。社交网络中的每个用户都相当于一个数据源,其数据量呈现出指数级的增长模式。这些数据的背后往往蕴藏的是有价值的信息;因此本文将对其进行可视化进而发现价值信息。可视化是社交网络分析的主要方法,它是先将关系网络描绘成点线图,然后再对图中节点的位置、中心度、密度等相关指标进行分析。目前,Gephi在观测、分析大数据,可视化方面较其他相关软件更为优秀。因此,这里将采用Gephi进行可视化布局。本文的主要工作如下:由于原始的对网页爬取数据的方式效率低下,本文将利用第三方开放平台进行实验数据的采集。同时采用对采集过程进行程序上的优化以进一步提高采集效率。其次,考虑到目前的网络布局算法在对大规模网络节点进行布局的时候不能够很好的保持网络结构,文中基于分类思想对用户进行分类后再利用谱聚类进行布局。该方法有助于对网络结构进行宏观上的把握。最后,本文提出一整套评价指标体系并利用采集到的数据进行实验对其进行因子分析、建立影响力评价模型。在其后的可视化过程中,本文再一次用散点图矩阵对采用因子分析法分析影响力评价指标的可行性进行验证。