论文部分内容阅读
随着Internet技术的不断发展,网络上产生了大量的信息,如何从中找到满足用户需求的信息成为研究的热点。传统的信息搜索技术已经不能很好的满足该方面的需求,为此,个性化推荐系统渐渐兴起。协同过滤技术是个性化推荐系统中一种常用的推荐技术,在理论和实践方面都取得了快速的发展,但传统协同过滤算法所面临的数据稀疏、冷启动、兴趣模型单一、用户相似性难以度量和可扩展性等问题仍影响着推荐系统的质量。随着web2.0出现和流行,社会化标签应运而生,它不同于一般的关键词,能精确地分析信息资源的特征以及用户的偏好,可以与用户和资源构成一个关系网络,为实现个性化的信息推荐服务提供新的解决思路,具有较好的研究和应用价值。经过深入的研究和分析,本文引入社会化标签语义相似度对传统的协同过滤推荐算法进行改进。首先,在考虑到标签存在语义信息的基础上,对社会化标签的特征进行分析,发现标签模糊以及同义标签匹配度不高等问题,因此提出一个结合WordNet与共现分析的标签语义相似性度量方法,分别从语义角度和统计角度对标签的关联度进行表示,进而扩大标签与项目、用户间的关系作用,提高信息的覆盖。其次,根据标签与项目间的关系,提出一个基于标签-项目语义关联的协同过滤推荐算法(CFSSTI),利用标签的语义相似度,对项目所关联的标签集建立标签与项目间的联系,从而得到项目间的关联,利用项目间的关系对评分矩阵进行填充,以缓解数据稀疏的问题,提高算法预测准确性。再次,根据标签与用户间的关系,提出一个基于标签-用户语义关联的协同过滤推荐算法(CFSSTU),根据用户所关联的标签集建立标签与用户间的联系,利用标签与评分信息重新构建用户兴趣模型,通过标签相似度对用户相似性进行度量,产生用户最近邻集合,从而得到相应的推荐。最后,将改进后的两个协同过滤算法与传统的协同过滤算法在MovieLens数据集上展开实验,从评分预测和项目推荐的准确度方面对结果进行评估,实验结果表明,引入标签语义相似度的协同过滤算法推荐质量有所提高。