基于聚类的加权Slope one推荐技术研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:caiwupim
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网中信息规模的爆炸式增长,满足了用户对信息的需求。但庞大的信息量使得用户难以快速定位到有用信息,降低了信息的使用率,导致了信息过载问题的出现。个性化推荐技术是一种面向用户进行个性化推荐的有效手段,其核心是推荐算法。  Slope One算法是一种简单而高效的基于项目的协同过滤算法,能够在少量数据情况下达到较好的推荐效果,已经得到了广泛应用。但现有的Slope One算法无法在数据稀疏情况下做精确推荐,评分过程中会利用无关项目预测评分且无法快速感知用户兴趣的变化。  为了解决上述问题,本文对权重的计算方法加以改进,提出改进的加权Slope One算法,再引入数据挖掘的相关技术,对数据进行分类和预处理,提出基于聚类的加权Slope One算法。所做的主要工作如下:  第一,在传统的K-Means算法的基础上,提出一种自动生成K个聚类中心的基于最小生成树的K-Means算法,有效解决传统的K-Means算法因初始聚类中心选取的随机性引起的局部最优问题,提高聚类效果;  第二,利用聚类结果对原始项目评分矩阵进行预测填充,解决算法存在的稀疏性问题,并根据聚类结果缩小推荐候选集的规模,减少推荐算法计算量;  第三,考虑项目属性和项目评分对项目相似度影响程度的不同,引入项目属性和项目评分的项目综合相似度计算方法,提高项目相似度的准确性;  第四,为了在算法中更好的反应用户兴趣的变化,突出新数据作用削弱旧数据。在推荐算法中加入时间权重,考虑影响时间权重的因素,提出加入访问频率的时间权重函数;  第五,根据本文提出的改进算法,设计推荐系统,介绍系统中模块组成、模块间调用关系和模块内部算法流程,利用MovieLens数据集在系统上进行验证。  实验证明,基于聚类的加权Slope One算法与传统推荐算法相比,聚类算法的加入能够有效解决稀疏性问题,减少计算量;项目相似度和时间权重的加入提高了算法预测的准确性和时间敏感度。整体算法在平均绝对误差上有着明显的降低,能够有效提高推荐系统整体性能。
其他文献
随着交通事业的快速发展,以商圈、交通枢纽为中心的人群聚集的公共场所越来越多。随之带来的安全隐含是政府和商家长期困扰的问题,及时获取准确的人群信息是解决这一问题的关键
三维重建是计算机视觉与计算机图形学领域一个重要的且富有挑战性的研究课题。此类技术致力于重建真实世界中的单个物体或者大规模场景,以期能在计算机环境下进行可视化的展示
随着互联网技术的快速发展,Internet上的信息也呈现爆炸式的增长;与此同时,网民数也在不断的增长,如何让用户在海量的信息中找到自己所需要的信息已成为信息检索领域一个非常
随着近几年互联网与信息技术的发展,互联网的规模得到了巨大的提升,它向用户提供的信息也正在急剧增加,我们正在面对一个“大数据”的时代。在这海量的数据中,如何获取最为符
随着社会的发展,人们在解决自身温饱问题即将奔小康的同时,安全问题也越来越受到人们的关注。监控系统也应运而生,智能音视频分析可以有效的帮助我们发现环境中需要人注意的显著
功能磁共振成像(functional magnetic resonance imaging,fMRI)数据分析一直是认知神经科学领域的研究热点之一。fMRI数据分类作为fMRI数据分析的一个重要子任务,已受到国内
在航拍视频中自动检测运动目标,是无人机执行空中侦察、火力打击等高层任务的基础,是提升无人机自主能力的关键技术之一。相对于摄像机固定的视频监控,无人机航拍具有机动灵活,监
虚拟现实技术(Virtual Reality),是一种利用计算机模拟出三维空间的虚拟世界,让使用者通过视觉、听觉等产生交互式的、沉浸式的体验感受,虚拟现实技术是计算机图形学、人机交互
随着无线基础设施的广泛部署,无处不在的无线接入服务己经成为人们生活和工作必不可少的一部分。同时移动互联网也如火如荼的发展着,基于位置的服务由于可以为人们提供更具体
由于目前经济的快速增长、企业竞争、服务意识的提高和互联网的迅速普及等因素,呼叫中心已成为客户服务及电话营销不可或缺的信息化平台。近年来,呼叫中心产业在呈现了飞跃性的