论文部分内容阅读
随着互联网的飞速发展,网络数据迅速膨胀,信息超载和信息迷航的问题日益突出,用户想要快速地从众多的数据中找到符合自己需求的信息越来越难。为了解决这个问题,研究者们提出了个性化推荐技术解决方案,其中应用最为广泛的是协同过滤推荐技术,但该技术中存在的用户兴趣迁移、冷启动、数据稀疏、可扩展性等问题,严重影响着推荐结果的准确性,所以如何解决这些问题是当前研究的重点。本文针对协同过滤技术中存在的数据稀疏、用户兴趣迁移和可扩展性问题对协同过滤算法进行改进,主要工作如下:(1)协同过滤算法的推荐效果往往会受到用户兴趣变化的影响,针对此问题,本文构建了一个基于用户类型偏好的兴趣迁移模型。该模型考虑用户对不同类型项目的偏好程度,根据评分时间对不同类型项目的评分进行不同速度的衰减。利用衰减后的项目评分矩阵进行用户相似度的计算和评分预测,有效地缓解了用户兴趣变化对推荐精确度的影响。(2)构建了一个适合协同过滤推荐算法的信任模型。该模型充分考虑了时间因素和用户评分数量对信任度的影响,利用T-采用率和可信度指标来计算用户之间的直接信任度和间接信任度。将信任度与基于时间的用户相似度进行线性组合,根据组合后的综合权重进行项目的预测和推荐,有效地解决了数据稀疏影响推荐精确度的问题。(3)针对协同过滤算法存在的可扩展性问题,本文利用K-means聚类算法对用户进行聚类,并提出了一种基于熵值法的用户属性相似度计算方法。该方法考虑不同属性对区分用户的贡献程度不同,准确地计算了用户之间的属性相似度,有效提高了聚类结果的准确性。(4)本文利用Movie Lens数据集设计了一系列实验对提出的改进算法进行验证。实验结果证明,本文提出的改进算法能够有效地提高推荐的准确性和可扩展性。