论文部分内容阅读
社交网络(Social Network Site, SNS)作为Web2.0时代的典型应用,在世界各地迅速流行起来,现已成为人们日常生活中不可或缺的一部分。在社交网络中,用户通过添加、关注好友等方式建立和拓展属于自己的社交圈,从而进行互动交流以及信息分享。然而随着社交网络规模的扩大以及用户数量的急剧增长,寻找好友、拓展自己的社交圈对普通用户来说变得越来越困难。为了解决社交网络信息过载问题,社交网络好友推荐系统应运而生。研究表明,社交网络中的用户不仅与现实生活中认识的朋友建立联系,还希望通过社交网络这个平台添加、关注一些有着相同兴趣爱好的新朋友。然而目前对于这类兴趣相似的“潜在好友”的推荐研究较少,且没有SNS网站提供潜在好友推荐的功能,这极大程度上抑制了社交网络的发展。为进一步满足用户基于兴趣的交友需求,本文以微博为例,将研究重点放在“潜在好友”的推荐上。目前社交网络好友推荐的方法中,基于关系的好友推荐所推荐的好友数量和范围非常有限,而基于内容的好友推荐所推荐好友的接受率和认可率较低。因此本文提出一种混合推荐模型,以期提高推荐效果。本文将主题模型引入到基于内容的推荐中,以解决传统向量空间模型(VSM)存在的不足。在主题推荐模块中,采用一种适用于社交网络的UserLDA模型,将同一位用户的所有微博文本聚集成一个用户文档,并采用Collapsed吉布斯抽样方法估计参数,将用户文档的在特征词上的向量转换成该用户在主题上的概率分布,以此体现其在隐藏“主题”上的兴趣偏好,从而根据用户的主题概率分布进行兴趣相似度的计算。在关系推荐模块中,将根据用户的链接关系网络计算关系相似度的过程看作是链接预测问题,对RA指数和Jaccard系数进行改进,使其适用于有向网络中,从计算用户之间的关系相似度。最后对两个推荐模块产生的相似度进行线性加权,根据得到的综合相似度向目标用户进行TOP-N潜在好友推荐。为了验证本文提出模型的有效性,将其应用于真实的新浪微博数据中,并与基于内容的传统向量空间模型以及基于关系的两阶段好友推荐模型进行实验对比,实验结果证明本文提出的混合推荐模型比其它模型具有较高的F1值,即能产生更好的推荐效果。