基于流式计算的个性化推荐系统的研究与实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户：zxzwo

【摘要】

：

【作者】

：

贾孝振

【出处】

：

西安电子科技大学

【发表日期】

：

2021年05期

【关键词】

：

流式计算推荐系统实时性冷启动矩阵分解交替最小二乘

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

目前,推荐系统无论是在电子商务还是在社交网络都占据着举足轻重的位置。传统的个性化推荐系统虽然能为用户提供准确的推荐服务,但面对不断变化的用户需求还存一些缺陷。由于传统系统定期批量计算数据,使得系统的计算结果无法实时反馈给用户,推荐的数据不能实时更新,使得推荐有滞迟,这即是推荐系统中的实时性问题。此外,在网站的初始阶段,由于用户-物品评分数据的缺乏,导致系统无法进行有效的推荐,这即是推荐算法中的冷启动问题。针对上述问题,本文设计与实现了一个基于流式计算的个性化推荐系统,即将解决冷启动问题的改进的推荐算法应用到推荐系统中,并根据实时的数据流更新推荐结果,本文主要包括以下研究内容:(1)针对推荐算法的冷启动问题,提出了一种基于相似度加权KNN的特征映射算法(Feature Mapping based on Similarity Weighted KNN,FM-SWK)。该算法首先运用相关相似度作为KNN算法的相似性度量方式,求得新用户或新物品的k个最近邻,然后结合用户或物品的属性向量来建立新用户或新物品和已有评分的用户或物品之间的映射关系,最后利用k个最近邻用户或物品的特征信息通过相似度加权的方式来估算新用户或新物品的特征值。其次,将FM-SWK算法和基于ALS-WR(Alternating Least Squares with Wighted Lmabda Regularization,加权正则化交替最小二乘法)的矩阵分解算法相结合,提出基于FM-SWK-ALS(FM-SWK and ALS-WR)的混合推荐算法,该算法利用FM-SWK算法求得的新用户和新物品的特征值,通过基于ALS-WR的矩阵分解模型对新用户或新物品进行推荐。同时,针对基于FM-SWK-ALS的混合推荐算法时间复杂度高和无关的用户和物品特征向量也被计算的问题,从用户和物品两个方面,提出适用于实时数据流的改进方案,该方案增量计算新用户或新物品的特征向量,规避不必要用户或物品特征向量的求解,然后将其应用到上述的混合推荐算法中。我们在搭建的Spark集群上使用公开的Movie Lens数据集对上述提出的混合推荐算法和其改进方案进行分析,将基于ALS-WR的矩阵分解算法和使用平均值填充新用户和新物品缺失评分值的AVG-ALS(ALS-WR based on Average)作为对比算法,从用户和物品两方面分析得出,基于FM-SWK-ALS的混合推荐算法的MAE(Mean Absolute Deviation)和RMSE(Root Mean Square Error)的值明显优于两种对比算法,其改进方案随着数据量的不断增加,迭代计算时间变化缓慢,满足系统计算时间需求。实验结果表明,基于FM-SWK-ALS的混合推荐算法可以在一定程度上有效地解决因由于用户-物品评分数据的缺乏无法进行有效推荐的问题,提高了推荐系统的推荐精度,其改进方案可以有效的提升算法的推荐效率。(2)针对传统推荐系统存在计算缓慢无法根据用户实时行为做出推荐的问题,本文设计并实现了一种能够实时计算的流式处理架构,将该架构和(1)提出的混合推荐算法相融合搭建基于流式计算的个性化推荐系统,并根据需求分析对系统模块进行设计和实现,主要分为基于Flume和Kafka的实时数据流模块、基于Spark Streaming的实时流计算模块和基于Spark中MLlib的推荐引擎模块,并使用HDFS和Hbase进行数据存储,前两者为在线处理部分,后两者为离线处理部分。系统通过将离线处理与在线处理相结合,也即由离线处理部分完成复杂度高、运算量大的计算,而由在线处理部分完成轻量级的计算,从而使得推荐系统能够实时响应用户行为。本文通过实验对设计出的实时推荐系统进行准确性和实时性能测试,其中,改进的FM-SWK-ALS混合推荐算法的准确率、召回率比传统的User CF、Item CF平均都要高出1.5%;本文搭建的实时推荐系统当瞬时数量在8000以内或评分速率在2500以内时,系统的平均响应时间都在5s以内。实验结果表明本文基于流式计算的个性化推荐系统具有良好的性能,在解决冷启动问题的同时,能够满足实时推荐的需求。

其他文献

橄榄油对雌性去势SD大鼠骨代谢标志物PINP和β-CTx的影响

目的:探讨橄榄油防治女性绝经后骨质疏松(Postmenopausal osteoporosis,PMOP)功效。实验中构建SD大鼠骨质疏松模型,通过对雌性去势SD大鼠骨代谢标志物I型前胶原N端肽(Procoll

学位

女性绝经后骨质疏松症橄榄油I型前胶原N端肽I型前胶原C端肽的β异构化形式骨密度测定

摩擦片-卡簧系统摩擦噪声测试与仿真研究

车辆的NVH(噪声、振动与声振粗糙度)性能一直是汽车制造商和消费者比较关切的一项指标,而其中车辆的振动和噪声问题更加受到重视。汽车制动系统产生的噪声不仅会对驾驶员造成干扰,对乘客的舒适度带来不好的体验,而且还会对城市环境以及周围行人造成一定影响。目前,针对车辆制动系统噪声的研究,大体上形成了试验分析、理论分析以及有限元分析这几种方法。研究者往往结合几种方法来分析制动系统噪声的产生机制及其影响因素。

学位

卡簧摩擦噪声试验测试有限元分析数值仿真

青海汉藏回撒拉族听力障碍人群的耳聋相关基因特征分析

目的:分析青海地区汉藏回撒拉族听力障碍人群常见耳聋基因突变情况,观察种族之间的差异性,为该地区的耳聋防治提供指导。方法:选取青海地区汉藏回撒拉族听力障碍人群450例,按不同民族进行分组,提取受检者外周静脉血DNA并行PCR扩增,应用基因芯片技术进行检测与结果分析,对4个民族的总突变率、不同基因及位点的突变率进行χ2检验,对比分析不同民族突变耳聋基因之间的差异性。结果:本研究共检出耳聋基因突变185

学位

听力障碍耳聋基因不同民族青海

阻塞性睡眠呼吸暂停低通气综合征患者血清脂联素与认知障碍的关系

目的阻塞性睡眠呼吸暂停低通气综合征（obstructive sleep apnea-hypopnea syndrome,OSAHS）是一种常见的睡眠呼吸障碍性疾病,它可引起患者认知功能障碍。目前研究发现OSAHS患者

学位

阻塞性睡眠呼吸暂停低通气综合征脂联素MMSE总分MoCA量表认知功能障碍

PPP项目投资对地方政府城投债发行的影响——基于土地资本化的传导渠道

文章主要考察了政府和社会资本合作(Public-Private Partnership,PPP)项目投资对地方政府城投债发行的影响,采用2012-2017年210个地级市的PPP项目及匹配城市特征数据进行实证分析。研究发现:第一,PPP项目投资额资本化到地方政府土地收入后,提升了地方政府城投债发行能力,缓解了地方融资约束;第二,PPP项目实施提高了地方政府城投债发现能力,传导渠道如下:PPP项目投资额资本化到土地收入中,政府通过抵押土地收入从而以更低的利率发行更多的城投债;第三,与其他固定资产投资相比,P

期刊

政府和社会资本合作城投债发行土地融资

红外宽波段高性能亚波长结构线偏振器件研究

纳米光子技术作为一个近年快速发展起来的学科,在器件集成化和微型化及器件的功能拓展与提高等许多领域有着很多潜在和现实的应用。本文利用等效介质理论和时域有限差分的数

学位

红外波段线偏振多层金属光栅多腔亚波长光栅理论设计实验制备

基于微服务的水土共治监管服务平台服务器端的设计与实现

现如今随着生态环境问题接连出现,人们对环境保护与治理的重视程度逐渐提高。建立一个能全面展示环境状况监测污染的信息系统,从而加强生态文明的建设,已成为政府的首要工作。本文在某公司的支持下,为全面展示某地区近几年围绕汉江生态治理所做的工作及效果,同时为各政府部门提供服务,完成了基于微服务的水土共治监管服务平台服务器端的设计和实现。本文研究的主要内容如下:1.本文分析了国内外环境监管信息系统的优势和存在

学位

微服务环境监管服务Spring Cloud数据可视化

公司年报主席致辞中信任修复的话语策略研究

信任在社会生活中普遍存在,是人际关系和亲密关系的基本要素。社会关系的可变性决定了信任的动态建构性,话语在这一动态协商过程中发挥重要作用。近年,信任构建研究逐渐趋向与话语分析相结合,但信任修复的话语研究尚有充实的空间,修复信任的话语策略有待进一步挖掘。本文选取2008年经济危机期间世界500强公司年报的30篇主席致辞,基于Fuoli&Paradis(2014)的信任修复模型,在考虑到语境特殊

学位

信任修复话语分析主席致辞金融危机语境

基于Hilbert分形设计的盘绕型声学超材料研究

低频声因其特有的穿透能力存在于日常生活、工业设备及军事等领域,对身心健康、产品制造及军事活动等带来不良影响。因质量密度定律的作用,常规声学材料无法有效地实现低频隔

学位

声学超材料自相似分形Hilbert分形曲线盘绕型结构负等效参数近零质量密度声隐身声遂穿热粘效应各向同性

土壤中地膜微塑料的分离与环境降解特性基础研究

根据国情,我国降解塑料的主攻方向仍然是地膜。在光、温、水、气及生物等综合环境作用下,能大大加快聚乙烯地膜质量变劣、力学性能下降或部分被生物吞噬的环境降解。本文以控制性栽植体-大型根窖实验装置(以下简称根窖)、自然有机质堆肥实验装置(以下简称堆肥实验装置)为研究平台,通过连续十年、每年两茬农作物的种植,开展不同类型土壤(沙土、粘土和壤土)中地膜残留物聚乙烯类微塑料的的筛分、表征及降解规律研究,分析地

学位

基于流式计算的个性化推荐系统的研究与实现

其他学术论文