基于多级相似度和信息核的协同过滤推荐算法研究

来源 :兰州交通大学 | 被引量 : 1次 | 上传用户:bilyy95
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的迅速发展和普及,数据资源以指数级别的速度增加,这使得用户在面对众多的网络资源时,反而无法高效选择出对自己有用的信息,进而出现信息超载问题。于是推荐系统应运而生,它依据用户的历史数据,通过用户的兴趣爱好来进行独特的个性化分析、计算,从而为用户提供有用的信息。现今推荐系统已广泛应用到社交网站,电子商务,电子学习,电影推荐和旅游等诸多领域。随着对推荐系统的深入研究,相应的研究难题也显露出来,例如对于新注册的用户,系统为其作推荐时的冷启动问题;用户评分矩阵中的数据稀疏性问题;随着用户和物品数目激增而带来的系统可扩展性问题,以及大多数算法只注重推荐相似物品而缺乏多样性的问题等等,这都影响了推荐系统的进一步发展。本文就协同过滤系统由于数据量增多而导致的日益严重的可扩展性问题、算法耗时长以及相似度函数度量准确性等问题,进行了如下内容的研究:(1)针对协同过滤推荐中存在的可扩展性问题,本文使用了提取信息核的方法。即将一个用户集的所有用户进行训练,提取出携带信息最具价值的核心用户组成信息核,这一过程为离线操作,这使得在计算用户相似度时,会大大节省内存和时间消耗。本文在原有基于频率(Frequency-based,FB)和基于排名(Rank-based,RB)的信息核提取方法基础上,提出了改进的信息核提取方法IFB(IFrequency-based)和IRB(IRank-based,IRB),在寻找最相似邻居环节提出了一个优化集的概念,在优化集上利用物品评分和用户相似度两项参考内容来为每个用户寻找最相似邻居,该算法在较大程度上同时也降低了推荐过程的时间复杂度。(2)针对推荐系统中用户相似度计算准确性问题,本文在传统度量标准皮尔逊相似度(PCC)的基础上做出改进,提出了多级相似度算法(Multi-Level Pearson Correlation Coefficient,MLPCC),算法分为五层,每层对应不同的约束条件和调节参数。在利用评分接近程度来计算用户相似度的同时,充分考虑了共同评分物品数量对用户相似度的影响,使共同评分物品数量越多的用户具有更高的相似度,优化了度量标准。在与多种推荐算法的对比实验中可以看出,本文的方法能够有效解决推荐过程的可扩展性问题,节省了大量时间开销,并减少了平均绝对误差(MAE),同时具有更高的准确率(Precision)和更好的召回率(Recall),推荐效果更优。
其他文献
目的本研究旨在探讨趋化因子受体2(CCR2)对血管紧张素Ⅱ(AngⅡ)诱导的小鼠心肌肥大发生的影响。方法8周龄、体重20-28g的SPF C57BL/6雄性小鼠24只,随机分为3组:正常对照组(简称对照组),AngⅡ+生理盐水组(简称AngⅡ组),AngⅡ+CCR2抑制剂组(简称CCR2抑制剂组),每组各8只。三组均皮下植入微型渗透释放泵。AngⅡ组和CCR2抑制剂组以1.3mg/kg/天的速度持
生物多样性是人类赖以生存的物质基础,在维持生态系统稳定性和功能性等方面起着极其重要的作用,其中野生脊椎动物是生物多样性的重要组成部分,而刚设立的塘墩湖保护区就缺乏
随着智慧城市的建设和人们对公共场所安全问题的重视,大量的监控摄像头被安置在各种公共场所保障我们的安全。广泛普及的监控摄像头提供了大量的视频信息,如何在这些视频信息
随着移动互联网的发展,面向餐饮等服务业的O2O电子商务模式逐渐凸显它的价值和发展潜力。但由于O2O平台所承载的数据量不断增长,导致了“数据爆炸但知识贫乏”的困境,信息过
人类获取外界信息最主要的感官是视觉,而图像又是视觉信息中的重要部分,图像质量决定了图像中信息量的大小和准确性,由此,图像的分辨率成为了图像处理中的重要参数。图像超分辨率(Super-Resolution,SR)重建是指通过一幅或多幅低分辨率(Low Resolution,LR)图像恢复出对应的高分辨率(High Resolution,HR)图像。传统的超分辨率算法往往具有复杂度高、限制条件多、图像
随着生活水平日益提高,消费者对食品在安全、卫生、健康、环保等方面的需求越来越严格,绿色食品受到越来越多消费者的青睐。本文研究了在一个消费者对于绿色食品标签认证和价
创新是经济发展的催化剂,是国家进步的动力源泉。要实现创新型国家建设,需要不断提升区域创新能力。而高校作为我国区域创新体系中的重要一员,其科研活动不仅是人才培养和知
设G是简单图,若我们将G的顶点集划分成两个互不相交的顶点集S,S,则称(S,S)为G的一个二部划分。设(S,S)为G的一个二部划分,若|| S |-| S ||≤1,则称(S,S)为G的二部平衡划分。本篇学位论文主要讨论带有边数条件限制的平衡二部划分问题。给定顶点子集S,我们用e(S)表示S导出子图的边数。在文献[4]中,Bollobas和Scott提出猜想:如果简单图G有m条边且最小度大于等于2
对单个重子谱信息的掌握,有助于加深对非微扰量子色动力学的理解,因为重子内部的重夸克给了我们一个“味道标签”来方便地去探索夸克相互作用的本质。与类氢原子类似,含有一
绝大多数盲人在无人陪伴的情况下缺乏指导,很难单独出门。盲道作为城市重要的基础设施,并没有发挥其应有的作用。因此,如何有效地利用盲道信息来帮助盲人出行成为学者们关注