论文部分内容阅读
随着互联网和信息技术的迅猛发展与日新月异,我们已经从信息匮乏进入信息过载(information overload)的时代。作为解决信息过载的主要方案,协同过滤技术在20世纪90年代一经提出,就迅速成为人机交互、机器学习和信息检索等领域的热门课题,并在以电商网站为代表的实际应用取得了巨大成功。本文主要针对以协同过滤为代表的推荐技术,进行了深入的研究。在对主流的推荐技术进行研究与分析之后,本文将研究重点放在了目前应用最广的基于项目协同过滤算法上。针对传统的基于项目的协同过滤算法存在的不足:1、传统的基于项目的协同过滤算法相似性计算方法,忽略项目属性值在相似性度量中的重要参考价值,造成算法稀疏性问题严重。2、传统的基于项目的协同过滤算法忽略用户评分的时间因素,因此不能反映用户兴趣点随时间的变化。3、传统算法的冷启动问题,当推荐系统引入新的项目时,无法将新项目推荐出去。基于以上三点不足,本文在传统算法基础上做了以下两点改进:1、分别基于项目评分与项目属性度量项目相似性,通过自适应平衡因子协调处理两方面的相似性结果,来综合考虑项目相似性;2、算法考虑用户对项目评分的时间因素,引入用户对不同项目的兴趣权重,进行评分预测;由此本文提出了一种新的基于项目的协同过滤算法IASUIA算法(基于项目属性与用户兴趣的推荐算法)。本文基于权威数据集Movielens对本文IASUIA算法进行了验证实验。实验结果表明,本文IASUIA算法对传统算法中存在的稀疏性问题、不能反映用户兴趣点随时间变化两个弊端起到了明显改善作用。