【摘 要】
:
针对传统协同过滤在推荐过程中存在的稀疏性、扩展性以及个性化问题,通过引入算法集成的思想,旨在优化和改进一种新型的基于Spark平台下的混合协同过滤。借鉴了Stacking集成学
【机 构】
:
首都师范大学 信息工程学院 计算机科学与技术系; 清华大学 计算机科学与技术系;
【基金项目】
:
北京市教委科技计划项目(KM201310028014)
论文部分内容阅读
针对传统协同过滤在推荐过程中存在的稀疏性、扩展性以及个性化问题,通过引入算法集成的思想,旨在优化和改进一种新型的基于Spark平台下的混合协同过滤。借鉴了Stacking集成学习思想,将多个弱推荐器线性加权组合,形成综合性强的推荐器。首先,算法基于近邻协同过滤,结合分类、流行度、好评度等对近邻相似度计算策略进行优化,旨在改善相似度的合理性以及相似度计算的复杂度,在一定程度上改善了评分稀疏性的问题;同时,该算法结合Spark分布式计算平台,充分借鉴分布式平台的优点,利用其流式处理以及分布式存储结构等特性,设计并实现了一种推荐算法的增量迭型,解决了协同过滤算法扩展性和实时性问题。实验数据采用UCI公用数据集MovieLens和NetFlix电影评分数据,实验结果表明,改进算法在推荐个性化、准确率以及扩展性上都有不错的表现,较以前同类型算法均有不同程度的提高,为推荐系统的应用提供了一种可行的算法集成方案。
其他文献
15世纪晚期至17世纪中期即都铎和斯图亚特王朝早期,由于财政赤字不断出现,英王为此采取许多弥补财政缺口的措施,财政借款就是其中之一。英王财政借款问题复杂,既涉及到借款对
研究目标:八大综合经济区科技创新能力的区域差距、时空转移、影响因素及其空间溢出效应。研究方法:运用泰尔指数、空间Markov链以及空间杜宾模型。研究发现:八大综合经济区
地震灾害不仅给人们造成经济损失更严重的是造成人员的伤亡。近些年来风振灾害常有发生,对土木结构造成许多结构性的损伤乃至整体结构破坏,影响了正常的使用功能。风灾害和地
经典的扩散过程理论已被广泛地应用到金融,工程等诸多领域。然而在许多实际问题中,系统可能受到某些突发事件的影响而出现瞬时大幅度的变化,或者受外部环境变化而频繁出现系统状
近年来,因内腐蚀引起的管道损坏、破裂、泄漏等事故频频发生,不仅造成了巨大的经济损失,还严重污染环境。开展管道内腐蚀预测及评价工作能为管道的安全运行提供有力保障。多相流管道内腐蚀问题是腐蚀与冲蚀共同作用的结果。本文采用OLGA和ECE仿真软件模拟多相流管道均匀腐蚀现象,研究流速、温度、压力、含水率、气油比、H_2S含量、路由等因素的影响规律;采用ANSYS 17.2 Fluent仿真软件模拟气液固管
我国第一支公益创投基金成立于2007年,截止到2018年底,公益创投基金已在我国发展了近十二年的时间,全国公益创投基金数量近百支,资产规模超过三百亿,虽然数量和金额不及西方发达国家,但依旧成为解决我国社会主要矛盾的重要力量。然而根据近两年公益创投基金发展报告可知,公益创投基金中存在政府投入占比高、市场化程度不足、创投方式运用不足等突出问题,导致公益创投基金的可持续发展存在较大问题。因此,对公益创投
高新技术产业已经成为我国经济发展的重要支柱,产业聚集与技术创新是经济发展的两个重要方面。山东作为我国东部沿海经济大省,高新技术产业现状如何,产业聚集呈现怎样的变化,
中国聚变工程试验堆(CFETR)可能是中国下一代聚变装置,其目标除了演示聚变能的产生之外,还将测试聚变堆的材料性能、关键技术以及验证氚自持。CFETR的概念设计研究已经完成,
目的探讨全反式维甲酸对肾毒性血清肾炎(NTSN)小鼠模型的作用及机制。方法使用肾毒性血清(NTS)尾静脉注射构建NTSN模型,设置对照组、NTS组、NTS+维甲酸组。NTS注射前5 d给予
研究目标:在相对收入假说的框架下,考察地区收入差距对家庭消费的影响,并深入探讨其影响机制。研究方法:利用城镇入户调查数据(UHS),并与宏观数据进行匹配,构建面板固定效应