论文部分内容阅读
互联网的快速发展给人们的生活带来了极大便利,同时也导致网络信息的急剧膨胀造成了信息过载问题。推荐系统因能解决信息过载问题并为用户提供个性化的服务而被广泛研究与应用,其中最为成功的是基于协同过滤的推荐系统,但其性能却受到了数据稀疏性问题的严重影响。因此,研究如何缓解数据稀疏性问题以提升协同过滤算法的各方面性能具有重要的意义。 通过系列统计实验,剖析了数据稀疏性问题对协同过滤算法性能的影响。针对稀疏的数据集,结合信任感知推荐算法适用于评分预估填充的思想,提出了一种基于修正信任的评分填充算法(Corrected Trust-aware Rating Filling Algorithm,CTRF)。其使用评分相似度对具有片面性的信任关系进行修正,并根据信任邻居的评分信息对用户的缺失评分进行预测填充。 针对现有邻居选择算法的不足,结合喜好不相似用户的评分同样具有聚合价值的思想,提出了一种动态多维邻居选择算法(Dynamic Multidimensional Neighbors Selection Algorithm,DMNS)。其将用户间的相似关系划分为四个维度,并根据用户相似度的分布情况动态选择并构建多维邻居。在CTRF的基础上结合DMNS提出了基于融合评分和多维邻居的协同过滤算法(Merged Ratings and Multidimensional Neighbors-based Collaborative Filtering Algorithm,MMCF)。其先使用CTRF对数据集进行预处理以得到融合评分矩阵,然后基于融合评分计算用户间的相似度,随后使用DMNS构建多维邻居,最后使用多维邻居的评分信息进行评分聚合预测。 在实际数据集上进行性能对比实验,实验结果表明,所提MMCF算法在预测覆盖率和准确度上均优于其它相关优秀推荐算法,也即表明将所提CTRF和DMNS算法应用于协同过滤中能有效的缓解数据稀疏性问题以提高其各方面性能。