论文部分内容阅读
作为Web 2.0时代的典型代表,微博在近年得到了迅猛的发展和广泛的应用。作为一个基于用户关系的信息分享、传播以及获取的社交网络平台,它不仅可以扩大人际圈实现社会交往,更是获取最新资讯和各方评论信息的重要媒介。如何在此平台为用户提供个性化的服务筛选出高质量的内容,有效降低用户获取有用信息的成本变得非常重要,而准确的发现用户的兴趣则是实现这种个性化服务的前提。在此前提下,用户兴趣推荐算法应运而生。本文以构建微博用户兴趣模型及推荐方法作为研究背景,针对微博长度短、信息量少,高维稀疏等特点,从微博用户标签入手,融合了标签关联关系与用户社交关系进行微博信息推荐。论文主要工作如下:(1)为了尽可能地去除微博短文本中包含的大量噪声数据,对微博内容的成分进行分析,去掉文本中大量的无关信息,并通过简繁转换、分词和去停用词方法尽可能地得到无噪声数据。(2)提出一种基于标签关联关系的微博推荐方法。该方法首先对于无标签或标签较少的用户,通过标签检索策略获取相应标签,构建用户-标签矩阵,得到用户标签权重来表示用户兴趣。另外,考虑标签间的关联关系,通过挖掘多标签的内联与外联关系,构建合理的多标签关联关系矩阵,对用户-标签矩阵进行更新,得到融合多标签间关系的新的用户标签权重,继而进行微博信息推荐。实验表明,该推荐方法能够有效地进行微博推荐。(3)提出融合标签关联关系与用户社交关系的微博推荐方法。在上一阶段的基础上,考虑用户与用户之间的社交信息关系,计算用户间社交关系相似度,构建合理的用户间社交关系相似度矩阵,并与先前阶段更新后的用户-标签矩阵进行迭代,得到最终的用户标签权重,进行微博信息推荐。实验表明,与忽略标签与用户间关系的微博推荐算法相比,该推荐方法能够更加准确地进行微博推荐。最终实验表明:本文提出的方法能够有效地表征用户兴趣并给出了相对准确的推荐结果。