论文部分内容阅读
随着科学技术的不断进步,人们已经开启Web2.0时代,随之而来的“信息过载”和“信息爆炸”问题也越来越严重,并且如电商平台等以盈利为目的的网站,存在着经济学中“长尾理论”的现象,即80%的盈利来源于20%的热门商品,但是剩下的80%商品拥有巨大的商业价值,如何将剩余的80%商品推荐给需要的人是解决这一问题的关键。海量的数据使人们需要花费大量的时间和精力去寻找自己所需要的信息,而推荐系统的出现大大地缓解了这一难题。推荐系统通过收集用户的历史行为或者用户的兴趣偏好经过推荐算法的计算来产生用户可能感兴趣的项目列表,在人们没有明确目的或者目的模糊的情况下,推送给用户可能需要的信息。但是推荐系统仍然存在着新用户或者新项目的冷启动问题、准确率问题以及大数据下实时性的问题。本文作者通过大量阅读、收集整理推荐系统相关知识,较为全面地介绍了推荐系统的基本理论知识,阐述了论文的研究意义和国内外的研究现状,针对现有推荐算法中的某些问题与不足进行了探究。本文的主要研究成果如下:首先,针对现有基于时间上下文的推荐算法仅考虑记忆遗忘曲线对用户兴趣变化的影响,而没有将物品以及用户本身具有的时间属性考虑到对用户兴趣的影响因子中,本文提出了一种改进后的基于时间上下文的推荐算法,主要是将用户的年龄以及物品的背景时间等属性融入到传统的时间衰减函数中,改变用户相似度权重对推荐物品的预测评分的影响,最后在真实的数据集上进行实验验证,对比传统的推荐算法本文算法在准确度等多项指标上有较大提升;其次,针对传统的基于哈希学习的推荐算法在二进制码相似性与用户偏好的等价问题,提出了改进的哈希学习推荐算法,在评分信息的处理方面通过去除评分偏置来更好地求解相似度,并通过加入用户和项目时间属性来缓解算法的冷启动问题,通过实验以及结果分析说明了算法的可行性。最后本文通过基于上述两个算法,设计并实现了结合离线推荐与实时推荐的电影推荐网站,在相似度计算方面,通过第四章提出的改进的哈希学习推荐算法缓解了评分信息与用户偏好不对等的问题,使得计算得到的相似度更好地放映用户的偏好进而提高推荐的准确率;对于冷启动等问题,通过本文第三章的改进的时间上下文推荐算法,将添加用户和项目的时间信息来缓解新用户以及新项目的冷启动问题。然后描述了网站的总体结构设计、具体流程的设计、实现的过程、主要的功能网页和推荐效果的展示。本网站加入了实时推荐部分,以便及时地跟踪用户兴趣偏好的变化,提升推荐结果的准确度。