论文部分内容阅读
最近几年,社会化媒体迅速发展,特别是微博,越来越流行。由于社会化媒体所表现的与传统媒体的不同特性,引起了研究者极大的兴趣。社会化媒体的实质是社会网络的应用,它的研究具有极大的现实意义。本研究选取社会化媒体研究中的一个应用--信息预测作为研究点。针对现阶段基于社会化媒体的信息预测,多是把社会化媒体作为数据获取的来源,仅从参与讨论的人数或者是情感倾向进行预测的现状,本研究充分考虑社会化网络的相关特性,研究社会化媒体的节点属性,并将之应用到预测中去,最终取得了很好的结果。
本论文的主要工作有以下四方面:
首先,通过对新浪微博的数据特点分析,证明了其具有的一些特性,如度具有幂律分布的特征、用户间关系存在“150法则”等,这些都是社会化网络所具有的性质,证明了使用社会化网络知识来进行新浪微博的分析是可行。
然后,对节点属性的概念做了突破性的定义,这也是本研究的重点。不同与以往着眼于全网结构的定义,本文的研究从预测目标出发,将节点属性分为静态属性和动态属性。其中,静态属性中的节点相似性定义、节点与预测目标的相关性都具有独创性,并通过实验证实了定义的可行性。在动态属性中,从中文文本分析角度,对微博情感倾向进行了分析,从行为动力学角度,对信息传播做了探讨。
而后,受PageRank算法启发,结合静态属性与动态属性,提出了基于预测目标的节点影响力的概念。该概念在评价节点在预测目标传播过程的作用中,显示出很好的效果。
最后,将预测目标分为销售型预测和映射型预测两类,分别选取票房预测和股指预测进行实验分析。在实验中,根据数据特点采用不同的预测方法,如灰度预测、因果回归预测、BP神经网络预测等,将加入了节点属性的预测结果与目前研究中仅仅考虑预测目标关注度和情感倾向的预测结果进行对比,得到的结果都说明了加入节点属性后,预测结果将更接近于真实值。
由于社会化媒体中蕴含着丰富的数据资源,无论是研究角度还是应用角度都是前景广阔。本研究仅仅从一个应用角度说明了社会化媒体的研究意义,虽然与现阶段的其他研究相比,取得了比较好的结果,但是也反映了一些问题,这些都将激励我们进行后续的研究,不断发现社会化媒体新的研究和应用价值。