论文部分内容阅读
互联网技术的发展推动着社会的不断进步,随着计算机和网络的普及度越来越高,人们的生活越来越趋向于数字化、电子化,大量数据的涌来使得传统的单片机处理能力上的局限越来越明显,计算机的数据计算能力和存储能力亟待提高。然而,单片机性能的提升相对海量数据来说依然十分有限,在这种背景下,云计算技术出现并开始发挥其重要的角色。社交网络作为新社会化媒体的突起,尤其是微博的出现已成为人们日常生活的重要组成部分之一。微博用户作为微博平台中的重要节点,其行为模式一直是微博研究领域的研究热点。本文对微博社交平台上用户影响力的评价问题及好友推荐问题展开研究,提出改进的算法模型,并借助云计算平台完成分布式改造。针对微博社交网络平台中的用户影响力评价问题,提出了一种基于HRank的评价算法。该算法将评价科学家科研绩效影响力的判定参数H指数引入进来,构造出能反映用户影响覆盖度的粉丝H指数和用户微博受追捧程度的微博被转发H指数,在此基础上,结合粉丝H指数和微博被转发H指数构建出对用户影响力进行综合评价的HRank模型。通过与新浪微博官方网站给出的影响力排名进行相关性实验表明,相对于目前普遍采用的PageRank算法,HRank算法得到的排名相关性提高了近10%,可有效实现对微博用户影响力的客观评判。针对社交网络中的好友推荐问题,提出了一种基于三度影响力理论的好友推荐算法。社交网络用户节点间的联系除了共同好友外,还存在其他不同长度的连通关系,该算法不再局限于仅以用户间共同好友的数量作为好友推荐的主要依据,而是在此基础上引入三度影响力理论进一步拓展关系连接,即把用户间距离三度以内的强连接用户都考虑进来。通过在新浪微博和Facebook社交网站上的实验表明,该算法比仅依据用户间共同好友数量的推荐算法在查准率和查全率上有了较大提高,显著提升了社交平台好友推荐的效果,从而为社交平台改进推荐机制,以进一步增强用户体验提供了理论支撑。由于基于三度影响力的好友推荐算法仅仅考虑的是用户间好友关系呈现的网络结构特性,并没有加入对用户行为特性的考虑。而用户影响力反映的正是用户在微博上的动态行为特性,所以,本文又将用户的影响力引入到基于三度影响力的好友推荐过程,探讨了考虑用户影响力后对微博好友推荐效果的影响。实验发现,同时考虑用户影响力和用户间的距离特性,更有助于提高微博好友推荐的性能。