【摘 要】
:
随着社会经济的稳步发展和互联网技术的日益普及,电子商务行业已经发展得较为成熟。本文着眼于随时间戳记录的浏览点击行为这一海量的用户隐式反馈数据,一方面借助深度学习能挖掘行为潜在信息的优势,引入自然语言处理中word2vec的思想,以词序列类比用户行为序列,以词的上下文共现关系类比商品在用户行为序列中的共现关系,即认为共现频率高的商品很可能存在较高的相似度,从而得到基于Negative Samplin
论文部分内容阅读
随着社会经济的稳步发展和互联网技术的日益普及,电子商务行业已经发展得较为成熟。本文着眼于随时间戳记录的浏览点击行为这一海量的用户隐式反馈数据,一方面借助深度学习能挖掘行为潜在信息的优势,引入自然语言处理中word2vec的思想,以词序列类比用户行为序列,以词的上下文共现关系类比商品在用户行为序列中的共现关系,即认为共现频率高的商品很可能存在较高的相似度,从而得到基于Negative Sampling的Skip-gram模型(SGNS)下的商品embedding向量;另一方面先是将用户行为转化为兴趣度矩阵,基于隐语义模型(LFM)得到用户和商品在隐因子下的embedding向量,再利用GBDT模型在连续特征处理上的优势和LR在离散特征处理上的优势,将LFM得到的用户embedding向量、商品embedding向量、人工统计特征作为GBDT-LR模型的联合输入,得到融合的点击率预估模型。最后,本文将两部分融合来获得更为精准的推荐结果,即利用SGNS模型得到的embedding向量对商品相似度的有效刻画能力,先基于用户历史行为得到点击商品在embeddingSGNS下的top-K近邻的商品集合作为粗召回部分,再利用LFM-GBDT-LR融合模型对粗召回商品进行点击率预估,实现精准的重排序。经过实验,SGNS模型下得到的embedding向量能有效地挖掘商品的隐式特征,LFM-GBDT-LR融合模型较单一模型在模型评估指标上的表现更好,融合了SGNS模型作为召回的LFM-GBDT-LR点击率预估模型不仅大幅降低了计算时间,同时具有较好的推荐效果。
其他文献
近年来,我国社会经济水平得到了大幅提高,人们收入水平显著提升,极大地推动了我国旅游产业发展,作为旅游支柱产业之一的酒店业也获得了快速发展。快捷酒店是酒店业的一种重要类型。快捷酒店的发展对满足游客多元化的消费需求具有重要作用。20世纪90年代以来,我国经济型快捷酒店大量涌现,在我国二、三线城市得到高速发展。然而,当前由于酒店在产品、服务、发展定位等方面日趋同质化,使得快捷酒店行业之间的竞争愈加激烈。
氧化锌(ZnO)是Ⅱ-Ⅵ族直接带隙半导体,室温下禁带宽度约为3.37 eV,激子束缚能为60 meV,热离化能为26 meV。在光催化、太阳能电池、传感器、光电探测器等许多领域都具有非常广泛
近年来,我国加快了高速铁路的建设,高铁设施的迅速发展带来时空压缩、要素流动、人口产业集聚、地方经济增长等一系列有利条件的同时,高铁站区现状建设存在的问题也逐渐显现,
体系贡献率是装备建设发展的一个新的更高标准。在装备规划论证中,为了实现对装备的体系化设计,提出了一种以体系贡献率为标准,以装备项目群为单位的论证方法。首先,针对遂行
前言国内在后续熔融铁水处理上,大都采用传统的铸铁机铸锭方法,铸成尺寸较大的块状;而颗粒的熔融时间较短,因此,对于大多数熔融工序而言,采用颗粒一般都能降低生产成本。采用
哮喘患者血浆及肺组织中腺苷水平升高,吸入腺苷可引起哮喘患者气道反应性增高,腺苷受体反义寡核苷酸能降低哮喘兔气道阻力,改善气道顺应性,提示腺苷是哮喘气道炎症中的一种重要炎
计算机视觉的美学研究工作,可看作对人类审美意识进行可靠的物化处理过程。利用图像、模型等众多视觉媒介丰富的颜色外观和几何结构等信息,借助计算机对数据一定程度上的视觉
母婴室作为一种以鼓励母乳喂养、体现社会关怀为最终目的的公共服务设施,对城市具有极高的社会价值和人文价值。近年来,国家和地区开始关注母婴室的建设,但是我国的母婴室建
目的:验证中文版流调用抑郁自评量表(CES-D)在广州大学生中信度和效度,分析阈下抑郁的在大学生中的患病率及流行情况(研究一)。探索强光疗和弱光疗对阈下抑郁大学生抑郁和焦虑的疗效(研究二)。方法:以广州在校大学生为研究对象。研究一方法:整群抽样收集2068名大学生,分别进行CES-D、贝克抑郁量表(BDI-II)和正性负性情绪调查量表(PANAS)的评定。验证CES-D结构效度、校标效度以及内部一
目的 系统评价黄芪注射液联合西药治疗支气管哮喘(asthma)的疗效。方法 计算机检索知网、维普、万方、Medline,CochraneLibrary,Embase,WebofScience等数据库,检索黄芪注射液治疗