论文部分内容阅读
随着互联网的发展,电子商务技术日渐成熟并广泛应用到大众生活当中。人们越来越喜欢在网络上寻找自己所需要的信息,因此各个网站研究的热点开始转向于根据网站自身已有的网络用户信息来推荐他们感兴趣的信息。协同过滤(Collaborative Filtering,简称CF)是最成功的个性化推荐技术,它借助已知的用户评价来实现对目标用户的推荐。典型的协同过滤推荐算法是基于用户的协同过滤推荐算法,它的基本原理是利用历史评分数据形成用户邻居,根据评分相似的最近邻居的评分数据向目标用户产生推荐。随着用户和项目数目的增多,如何提高算法的可扩展性和推荐质量是协同过滤技术面临的主要问题。论文提出两种优化算法,一是基于用户特征模型的协同过滤推荐算法,二是基于贝叶斯算法的协同过滤推荐。基于用户特征模型的协同过滤推荐算法是将传统的基于用户的协同过滤推荐算法进行优化,从用户共同评分项目的稀疏性问题入手,首先在离线环境下根据用户特征利用一个既定公式计算出用户u与v之间的特征相似性,形成一个用户特征相似性矩阵,为了提高查找速度,根据特征相似度的大小建立特征邻居排序链表。建立完用户的特征模型之后,统计出两个用户评价过的所有项目,这些项目可以只被其中一个用户评价过或者被两个用户同时评价过。对于只被一个用户评价过的项目,可以根据未评价过它的用户的特征邻居的评分进行预测,产生一个预测值。经过该处理后,被两个用户共同评价的项目集大大增加,解决了相关相似性度量方法和修正的余弦相似性度量方法中共同评价过的项目集比较小的问题,解决了余弦相似性度量方法中对所有未评分项目评分都为0的问题。在一定程度上缓解了协同过滤推荐的稀疏性问题,提高了推荐质量。基于贝叶斯算法的协同过滤推荐首先引入一个阈值θ对用户相似度的计算进行调整,然后结合用户对项目的兴趣度将用户分组,用贝叶斯算法对用户特征进行分析,从而计算出具有不同特征值的用户对未评分项目喜欢的概率,最后与兴趣度结合,确定调节因子δ的取值,将用户相似度公式进一步优化,从而使用户最近邻居的计算更加精确。最后根据其最近邻居对项目的评分信息预测目标用户对未评分项目的评分,取出预测评分最高的前n项推荐给用户,完成推荐。最后,将两种优化算法进行组合推荐,提出基于用户特征模型和兴趣度的优化协同过滤推荐算法,利用第一种方法对评分矩阵进行填充,增加被两个用户共同评价的项目数,以缓解评分数据的稀疏性。前期的处理提高了用户之间初始相似度计算的准确度,然后再结合用户对项目的兴趣度将用户分组,用贝叶斯算法对用户特征进行分析,从而计算出具有不同特征值的用户对未评分项目喜欢的概率,最后与兴趣度结合,确定调节因子6的取值,将用户相似度公式进一步优化,从而使用户最近邻居的计算更加精确。最后取出预测评分最高的前n项推荐给用户,完成推荐。实验结果表明,与传统的基于用户的协同过滤推荐算法相比较,提出的算法有更高的有效性和准确性,提高了系统的推荐质量。