论文部分内容阅读
随着互联网中信息量的急剧增长,人们在海量信息中快速获得自己感兴趣的信息变得越来越困难。如电子商务、社交媒体、音乐、视频、问答等站点,信息量越来越庞大,而用户所关心与关注的往往是很少的一部分。个性化技术强调从用户兴趣出发,针对不同用户提供特定的个性化服务。其中,推荐系统根据用户历史信息发现用户的兴趣,从而主动向用户推荐其可能感兴趣的资源,帮助用户快速获取有用信息。协同过滤技术是一种基于用户显性评分行为的推荐技术,是应用最早且最为成功的推荐技术之一。然而,随着系统中用户数量与项目数量的与日俱增,其面临着两个主要挑战:(1)提高协同过滤推荐算法的扩展性,实时处理大量动态数据;(2)降低系统中评分数据的稀疏性,提高推荐精度。研究了一个改进的协同过滤算法——同时基于用户与项目两个维度进行联合聚类的协同过滤方法。聚类后的矩阵规模远远小于原始评分矩阵,且同一类别内部的评分具有相似的模式,可快速灵活的进行评分预测。针对该离线聚类模型的增量更新机制提出了改进方法,将新的评分数据加入平均评分最接近的类别。针对基于加权非负矩阵分解的评分预测方法中初始值填充问题,提出了结合基线估计的初值填充方法。最后在MovieLens数据集上进行聚类效果实验与评分预测实验,验证了该联合聚类方法的有效性与实用性。