标签协同过滤推荐算法的研究和若干改进策略

来源 :江苏科技大学 | 被引量 : 3次 | 上传用户:hb9527
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网新技术的发展带动着新应用的出现,社交网络、电子商务就是典型的新型网络应用。这种新兴的应用的发展成熟又促进了新技术的诞生。随着信息量的增大,无论是电子商务还是社交网络都需要一种系统来将大量信息中的商业价值发掘出来。推荐系统就是这种技术。但是,推荐系统也面临着诸如冷启动、数据稀疏,计算量大,预测精度不准等问题。本文对于推荐系统的研究主要就是为解决这些问题提供一些新思路。关于数据稀疏问题的解决思路有很多,使用用户的基本信息,利用二部图的信息传递思想,使用缺省投票方式,还可以使用数据“平滑”技术解决稀疏问题。而冷启动问题是一种特殊的数据稀疏问题,除了上述方法,还可以使用混合算法解决此问题。为了解决数据量大,预测结果质量低的问题,本文认真研究了传统推荐算法的优缺点,找到其中可改进之处,结合统计思想、聚类思想和建模思想,针对标签系统和协同过滤推荐算法提出了三种改进策略。首先,本文研究的主要是标签推荐系统,但第一步仍然是先通过用户评分矩阵,求出用户对物品的偏好信息;通过使用TF-IDF的思想计算用户对标签的偏好矩阵以及标签和物品的关联矩阵,以此计算出用户对物品的喜好程度,从而完成推荐。其次,为了解决数据量大的问题,本文提出了使用谱聚类的方法来进行有效数据的过滤。在上述方法的基础上,使用聚类的思想,采用谱聚类的方法将用户分成若干类,在用户所属的类中进行数据的处理,大大减小了数据量的压力。最后,在标签的语义层面进一步挖掘有效信息,使用LDA模型对标签进行主题提取,然后结合本文提出的前两种算法,得到一种新的推荐思路。实验结果表明,和基本的协同过滤相比这三种算法在召回率,准确率上都有更好地表现。
其他文献
在天津滨海新区的围海造陆工程中,淤泥质吹填土经过真空预压加固处理后与吹填场区正常沉积的软土形成了典型的“上软下硬”的双层软黏土地基。这种双层地基有着复杂的工程特
东亚气候系统是受到多因子调控的气候系统。在全球气候变化背景下,东亚气候变异的过程和机制尤显复杂。本文利用CFMIP-3(云反馈模式比较计划)中的一组大气环流模式先导试验对东
瑞香狼毒(Stellera chamaejasme L.)是一种具有入侵性的多年生有毒杂草。由于过度放牧等原因,瑞香狼毒不断增殖、扩展。目前,其在我国的危害面积已经达到133万公顷,是我国牧
目的:探讨初情期前与初情期大鼠下丘脑DNMTs和MBPs mRNAs的表达差异以及DNA总体甲基化水平的变化,并构建其全基因组DNA甲基化谱。方法:(1)取10d,25d,35d,初情期(阴门开启为标
随着城市化水平的提高和经济的高速发展,尤其是由于现代化社会和城市化带来水资源紧缺和生态环境恶化方面的问题。雨水利用技术又逐步受到重视并有了很大进步。我国的城市雨
高光谱遥感图像极高的光谱分辨率能够很好地反映地表地物的不同材质特性,使得高光谱图像比多光谱图像更适合于地物分类,因此得到了越来越多的关注和研究。在高光谱图像分类时
本文总结了20世纪60年代以来,关于重力波的活动特征、激发条件和天气意义,尤其是与中尺度天气灾害如暴雨的密切关系,并回顾了对西南涡结构特点和发展机理的研究进展,在此基础
随着我国经济的发展,国家对基础设施建设的投入也稳步增长。鉴于我国幅员辽阔,地质情况多变,公路隧道、铁路隧道、地铁以及其他地下工程也与日俱增。这些地下工程的沿程建设
目的:观察蒙药匝迪-5对慢性轻度不可预见抑郁模型大鼠海马内PI3K/AKT/BCI-2信号通路的影响,探讨其对抑郁模型大鼠海马神经元凋亡的影响及作用机制。方法:将100只雄性SD大鼠适应性喂养一周后按体重随机分为10组,每组10只,分别为正常对照组、模型组、西药组、匝迪-5高剂量组、匝迪-5中剂量组、匝迪-5低剂量组、LY294002+匝迪-5高剂量组、LY294002+匝迪-5中剂量组、LY29
方钢管混凝土组合异形柱(简称SCFST柱)结构体系受抗侧力性能的影响,在高烈度区高层住宅中的应用值得深入研究。将减震技术应用于异形柱结构,对于推广该结构在高烈度区高层住