论文部分内容阅读
信息技术的发展和互联网规模的壮大,必然导致用户信息接收量的几何增长,信息过载的时代已经来临。在这样一个时代里,我们每天接收着来自外界海量的信息,并不能够有效的选择和筛选。这种情况下,无论是信息的消费者还是信息的提供者,都遭遇到前所未有的挑战。消费者怎样从漫天的信息里寻找到自己所需要的信息,生产者如何让自己的信息被推送至需要它们的消费者那里,成为双方共同想解决的难题。推荐系统就是为了解决这样的困难而产生的:将用户同信息关联起来,通过分析用户的个人喜好,帮助用户筛选过滤信息,挑选那些可能会有用的信息呈现给用户。几乎所有的研究人员和推荐服务提供商,都在推荐算法的研究领域试图有所突破,因为这是推荐系统最核心的部分。本文首先研究了当前比较流行的一些算法,包括基于内容的推荐算法、基于邻域的推荐算法、数据降维方法、基于图的推荐算法等,这些算法都各自有其优缺点和不同的适用范围。基于物品的协同过滤算法是目前最受欢迎的推荐算法之一,它具有较高的预测准确度,并且具有解释的能力。Slope One算法作为一种简单、高效易实现的算法,是最近几年才被提出来的。本文借鉴基于物品的推荐算法中物品相似性度量的思想,对Slope One算法进行了改进,使用修正的余弦相似性对其进行加权。实验结果表明,我们的改进算法比传统的Slope One算法具有更高的预测准确度。融合技术近几年受到了研究人员的关注,它可以将单一的推荐算法按照一定的策略,融合为复杂的推荐算法,单一的推荐算法可能会互相弥补对方的不足,使得新的融合算法具有更好的普适性与预测性能。Netflix Prize冠军队伍获胜的算法便是采用了融合技术。本文受到融合技术的启发,在用修正的余弦相似性对SlopeOne算法进行加权之后,使用基于物品的协同过滤算法与之融合。通过实验,寻找到新的融合算法进行预测工作时候的最佳参数。比较了它与之前算法预测准确度,最后得出结论,新的融合算法综合了两种算法的优点,在两种评测指标上都表现出色,这是它所融合的两种算法都不能达到的。