基于MapReduce的微博好友推荐研究

来源 :东北林业大学 | 被引量 : 0次 | 上传用户:yejunlan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网技术的发展推动着社会的不断进步,随着计算机和网络的普及度越来越高,人们的生活越来越趋向于数字化、电子化,大量数据的涌来使得传统的单片机处理能力上的局限越来越明显,计算机的数据计算能力和存储能力亟待提高。然而,单片机性能的提升相对海量数据来说依然十分有限,在这种背景下,云计算技术出现并开始发挥其重要的角色。社交网络作为新社会化媒体的突起,尤其是微博的出现已成为人们日常生活的重要组成部分之一。微博用户作为微博平台中的重要节点,其行为模式一直是微博研究领域的研究热点。本文对微博社交平台上用户影响力的评价问题及好友推荐问题展开研究,提出改进的算法模型,并借助云计算平台完成分布式改造。针对微博社交网络平台中的用户影响力评价问题,提出了一种基于HRank的评价算法。该算法将评价科学家科研绩效影响力的判定参数H指数引入进来,构造出能反映用户影响覆盖度的粉丝H指数和用户微博受追捧程度的微博被转发H指数,在此基础上,结合粉丝H指数和微博被转发H指数构建出对用户影响力进行综合评价的HRank模型。通过与新浪微博官方网站给出的影响力排名进行相关性实验表明,相对于目前普遍采用的PageRank算法,HRank算法得到的排名相关性提高了近10%,可有效实现对微博用户影响力的客观评判。针对社交网络中的好友推荐问题,提出了一种基于三度影响力理论的好友推荐算法。社交网络用户节点间的联系除了共同好友外,还存在其他不同长度的连通关系,该算法不再局限于仅以用户间共同好友的数量作为好友推荐的主要依据,而是在此基础上引入三度影响力理论进一步拓展关系连接,即把用户间距离三度以内的强连接用户都考虑进来。通过在新浪微博和Facebook社交网站上的实验表明,该算法比仅依据用户间共同好友数量的推荐算法在查准率和查全率上有了较大提高,显著提升了社交平台好友推荐的效果,从而为社交平台改进推荐机制,以进一步增强用户体验提供了理论支撑。由于基于三度影响力的好友推荐算法仅仅考虑的是用户间好友关系呈现的网络结构特性,并没有加入对用户行为特性的考虑。而用户影响力反映的正是用户在微博上的动态行为特性,所以,本文又将用户的影响力引入到基于三度影响力的好友推荐过程,探讨了考虑用户影响力后对微博好友推荐效果的影响。实验发现,同时考虑用户影响力和用户间的距离特性,更有助于提高微博好友推荐的性能。
其他文献
数字水印技术作为信息隐藏技术研究领域的重要分支,是实现多媒体版权保护与信息完整性保证的有效方法。与图像和视频水印技术相比,数字音频水印技术面临着更大的挑战。本文主
学位
近几年,随着信息技术,无线通讯技术和计算机硬件技术的迅猛发展,移动数据库应运而生。 移动数据库也称为随身携带的数据库,它是指支持移动计算环境的分布式数据库,通常应用在掌
相同的问题可用多种算法解决,而所采用的算法质量的优劣直接影响算法甚至程序的效率,算法的质量直接体现在算法复杂度上。本文旨在样条权函数神经网络的基础上,研究第一类分
本文对赤峰学院自行设计开发的计算机应用基础课课程考试系统进行了介绍。该考试系统是一套基于Client/Server(客户端/服务器)架构的多层分布式网络考试软件系统。系统功能全
在信息检索方面,基于关键词和主题分类的传统的检索技术越来越不能满足用户的需求,而且由于网络用户的知识背景的差异和自然语言的多义性导致网上信息检索的查全率和查准率较
本文从理论、算法和应用三个层次研究了关联规则算法在Web日志挖掘中的应用。首先系统、全面地分析和论述了数据挖掘技术以及Web挖掘技术,着重研究了Web日志挖掘过程中各环节
随着网络技术的不断发展,传统的Client/Server通信模式已经不再适应网络应用新的要求,P2P网络以其分布性、可扩展性、健壮性、负载均衡等方面的优势获得了越来越多的应用。然而
在现实生活中阴影为我们提供了大量的三维空间信息,虚拟场景中阴影不仅能够增强场景的真实感,同时也能够帮助判断场景中物体的空间相对位置关系。阴影绘制算法的真实感和实时
当今,智能虚拟人在人工智能领域和虚拟现实领域都起着日益重要的作用。将人工智能领域中的相关技术与虚拟人结合,构造出具有自主行为能力的虚拟人成为当前研究的一个重要内容