论文部分内容阅读
随着互联网的迅猛发展,推荐系统已经渗透到了互联网中的各方各面,包括电影、书籍、音乐、新闻、网上购物等等。并且在如今信息暴涨的背景下,推荐系统显得尤为重要,推荐技术也越来越受到学者的关注。协同过滤技术是推荐系统(Recommender System)最为核心的技术之一,也是目前应用最为广泛和成功的技术。虽然协同过滤推荐技术取得了很大的成功,但是传统的算法本身还是存在一些问题,这些问题包括:数据稀疏性问题;冷启动性问题;系统可扩展性问题。其中数据稀疏性问题直接影响了推荐系统的推荐精度,冷启动问题造成了新用户对推荐系统忠诚的下降以及新项目的无法被推荐。这些问题都是协同过滤推荐系统中必须要想办法解决的问题。本文对协同过滤推荐算法中的这些经典问题做了深入的分析和探讨,针对稀疏性问题本文采用了基于项目与项目间的交集个数权重的相似度改进计算公式;针对冷启动问题,论文采用了利用项目本身的类别属性来缓解新项目问题的方法。该方法通过类别属性计算新项目和其它项目间的相似度,得到新项目的最近邻,通过新项目的最近邻的评分数据来预测新项目的评分。实验表明,本文提出的改进算法在推荐精度上优于传统算法。目前改进的算法已经被运用到一个的具有推荐功能的电影网站,实现了理论到实际应用的过渡。该网站除了具备智能推荐功能,还实现了比较特色的好友系统,通过好友系统,你可以发现和你兴趣相似的用户并加为好友。通过上述的研究工作,从一定程度上解决了推荐系统的协同过滤算法所遇到的稀疏性问题、冷启动问题。