推荐系统中动态推荐算法研究

来源 :北京交通大学 | 被引量 : 4次 | 上传用户:bohedan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网技术的飞速发展使人类进入了大数据时代,“信息过载”成为亟待解决的问题之一。推荐系统作为一种解决“信息过载”问题的技术已被广泛应用于互联网应用。传统基于统计学习和深度学习的推荐技术通过定期更新模型来应对物品流行度的变化和候选集的更新,不能及时根据物品流行度的变化而更新推荐优先级,新物品加入时也不能迅速地完成冷启动。动态推荐算法(如多臂老虎机Bandit)能够一定程度上解决上述问题,但准确度有待提高,这是因为:1)它们的模型能力有限,以Contextual-Bandit类算法中的LinUCB为例,LinUCB算法采用线性模型拟合用户对特定物品的兴趣,表征能力有限,由此限制了算法性能;2)它们没有考虑用户特征分布的异质性,推荐效果不佳。针对以上两个问题,本文选定新闻推荐作为动态推荐算法的具体场景,基于一个大规模、真实的在线新闻系统的用户行为日志,测量了该新闻推荐系统中新闻流行度的动态变化、新闻上下架的模式,观察了用户特征分布。基于观察结果,提出了两个算法来分别改进上述问题,并基于实际数据对算法进行了评估。主要贡献如下:(1)针对现有模型表达能力欠佳的问题,本文提出使用神经网络代替常规数学模型来建模用户和期望回报之间的关系,解决了神经网络在线更新和损失函数选择的两个难题。具体来说,为解决神经网络的在线训练在样本不均衡的情况下难以收敛的问题,我们提出了用户反馈敏感的训练方法:根据不同的用户反馈采用不同迭代次数。该方法相对于传统的训练方式取得了近40%的增益。其次,本文将推荐问题建模为回归、分类和策略梯度问题,系统地尝试了分类、回归和策略梯度三种损失函数。通过实验发现:在合理的配置下,采用策略梯度的损失函数,我们的算法相较于LinUCB算法取得了 2.1%的性能增益,证明了算法的性能。(2)针对传统Contextual-Bandit算法没有考虑用户特征异质性的问题,本文创新性地提出了一种对用户特征敏感的分级推荐算法。该算法能够动态判别用户所属的类别,然后根据用户的类别,动态匹配合适的推荐器,来获得最佳的推荐性能。实验表明,该算法相较于传统的LinUCB推荐算法取得了 3.3%的性能增益,证明了算法的性能。本文在Contextual-Bandit动态推荐算法上的研究,进一步提高了当前主流动态推荐算法的性能,具有一定的理论价值和应用价值。
其他文献
通过理论研究和有限元仿真分析了热效应对两种不同质量块布局的双端固支梁的等效弹簧系数的影响,两种质量块分别布局为质量块与梁对称布置和质量块位于梁平面一侧布置。推导
[目的]探讨如何通过影像学手段避免在踝关节骨折中漏诊胫骨远端局限性压缩。[方法]对本院足踝科2013年1月~2014年1月住院诊治的149例踝关节骨折的影像学资料进行测量及归纳分
<正>通过上两期对历史数据的客观分析,可以总结出如下7点对基金定投的看法。有实际价值我国资本市场整体上还是一个非有效市场,通过投资管理人发挥主观能动性的努力,可以实现
<正>在上涨下跌两种行情下,选择不同时间段进行基金定投所获得收益也各不相同。行情上涨期的表现上证综指和深证成指2006年1月1日和2007年12月31日的表现以及所跟
基于建设用地集约利用评价指标,应用文献统计法和综合分析法,阐述了中国建设用地及建设用地集约利用评价指标权重赋权方法的现状,着重研究了各种权重确定方法在建设用地集约
[目的]探讨鞘翅目昆虫多样性变化对不同生境类型的生态反应。[方法]选取哈尔滨市不同生境区域中的样地,分析鞘翅目昆虫的群落结构及其多样性。[结果]共获得鞘翅目昆虫标本3 2
早在20世纪20年代初,黎锦晖先生倡导的通过歌舞进行美育的教育理念就已经影响到中国的城乡学校。甚至东南亚也成了儿童歌舞的原型和前身。直到20世纪90年代,中国开始提倡素质
β2肾上腺素能受体(β2 Adrenergic receptor,β2AR)属于GPCR家族,广泛存在于动物机体的平滑肌上,与肾素分泌、糖原分解相关。鉴于β2AR的相关生物学效应,人们将β2受体激动
提高用户电能质量是当前智能电网研究的主要目标之一。针对电能质量监测系统中包含的监测终端、通信系统和监控中心3个组成部分,对智能电网技术框架下电能质量监测与分析技术
数据挖掘是指从海量的数据中发现隐含的、具有价值的信息的过程,通过潜在模式的发掘为企业提供决策依据。传统的数据挖掘技术多针对于离线知识库,利用聚类分类等算法来处理数