论文部分内容阅读
随着互联网、物联网以及云计算等技术地快速发展,我们的生活也发生了翻天覆地的变化。我们在享受先进技术带来的便捷的同时,也承受着它们所带来的负面影响,信息过载就是其中之一。针对信息过载问题,早期主要有分类目录与搜索引擎两种解决方法,但均有其局限性,分类目录只能覆盖少数项目,相对于海量项目来说远远不够;搜索引擎则需要有明确需求,无法满足用户的个性化需求。为了更进一步解决信息过载这一难题,研究人员提出了推荐系统概念。推荐系统通过对用户历史行为地分析,发掘出用户潜藏的兴趣喜好,并且能够实现对用户的个性化推荐。推荐系统的核心部分就是推荐算法,现今在实际系统中运用最为广泛的算法就是协同过滤推荐算法。但是,随着推荐系统的进一步应用,传统的协同过滤推荐算法存在的诸如冷启动、数据稀疏性、推荐精度低、长尾项目发掘能力低等问题,使其不再满足实际应用需求。目前针对推荐系统的研究十分火热,不过相当多的研究工作主要将焦点放在如何提高推荐的准确度上,虽然取得了一定成果,但是无法兼顾推荐结果的新颖度,导致推荐新颖度仍处于比较低的水平。本文提出了基于项目相似度改进的协同过滤TopN推荐算法,该算法主要研究目的在于增强长尾项目发掘能力的同时,不降低推荐结果的精度。主要工作包括:1.分析用户活跃度对推荐结果的影响,引入用户活跃度概念,削弱活跃用户对推荐结果的影响,提高长尾项目的发掘能力,提高推荐结果的覆盖率。2.分析项目种类对推荐结果的影响,对相似度矩阵进行归一化处理,削弱同类项目只见相似度过高对推荐结果的影响,提高推荐结果的精度,增强推荐结果的可靠性。3.采用推荐领域经典的MovieLens数据集对改进算法进行分步仿真,验证改进算法每一步骤的有效性。