论文部分内容阅读
随着互联网和电子商务的飞速发展,互联网为用户提供越来越多的信息和服务,用户在得到便利的同时也不得不面临大量的垃圾信息和无意义数据,即所谓的信息超载问题。面对海量的网络资源,个性化推荐系统能够及时跟踪用户的需求变化来自动调整信息服务的方式和内容,是一种极具潜力的解决信息超载的服务技术。 本文详细介绍了个性化推荐系统中常用的几种推荐算法如:协同过滤推荐算法、基于内容的推荐算法、基于关联规则的推荐算法和混合推荐,并详细介绍它们的相关知识。协同过滤技术是目前推荐系统中最成功和应用最广泛的技术,在理论研究和实践中都取得了快速的发展,它根据用户的历史选择信息和相似性关系,收集与用户兴趣爱好相同的其他用户的评价信息来产生推荐。然而,传统的协同过滤推荐算法具有数据稀疏、推荐精度以及用户相似性难以计算等问题。本文针对这些问题,对协同过滤算法进行了相应的改进,主要工作如下: 传统的推荐算法在计算目标用户邻居集时只考虑用户项目评分矩阵中的具体数值,没有考虑用户偏好以及用户评分与项目属性之间的关系,推荐精度也有待进一步提高。针对这一问题,本文提出了一种基于用户偏好和项目属性的协同过滤推荐算法(UPPPCF)。本算法在传统的用户项目评分矩阵基础上综合考虑用户偏好以及项目属性,把评分矩阵转变成基于用户偏好的用户项目属性评分矩阵,然后根据这一评分矩阵来计算目标用户的最近邻居集,克服了传统相似性计算方法只依靠用户评分值的不足,同时本文对预测值判定给出了一种有效的度量方法。在MovieLen数据集上的实验结果表明,本文提出的UPPPCF算法能够有效地弥补传统的协同过滤算法中的不足,而且在推荐精度上有了明显的提高。 针对传统的协同过滤技术在产生推荐时只考虑用户项目评分信息而易受数据稀疏影响的问题,引入了项目类别属性以及共同评分数量。提出了一种基于共同评分和项目类别的混合推荐算法,该算法首先使用一种基于项目类别的IBCF算法来对原始的高度稀疏的用户项目评分矩阵进行填充,经过填充以后得到一个稀疏度降低的用户评分矩阵,然后在该矩阵的基础上采用基于共同评分的UBCF算法来进行最终的推荐计算。该算法将基于项目类别的IBCF与基于共同评分的UBCF相结合,将充分利用算法的各自优点。实验结果显示相较于协同过滤推荐算法以及其他改进算法,提高了算法的有效性和推荐准确性。