基于降噪堆栈式自动编码机的协同过滤推荐算法

来源 :重庆大学 | 被引量 : 0次 | 上传用户:LITAO14073164
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网技术快速的飞速发展将人类带入了一个前所未有的信息时代,人们创造、存储、查询信息的速度正在以指数量级增长,尤其是电子商务的蓬勃发展使每一个人的生活方式发生了巨大的转变,电子零售商和内容提供商为消费者提供了琳琅满目的商品和丰富多彩的信息以期满足不同类型消费者的喜好与需求。人们浸淫在信息的海洋之中却茫然无措,用户要高效准确的找到符合自己个性化需求的信息或商品则如同海底捞针,只能望洋兴叹。个性化推荐技术作为信息过滤的有效方式极大的缓解了信息过载的现状,在工业界得到了广泛的应用,但仍然存在诸问题亟待解决,因此在学术界推荐技术仍保持着持续的研究热度,加之近年来深度学习方法在各领域都取得了优秀的成果,但在推荐系统领域的应用研究还相对较少。本文首先全面的分析了现有推荐技术中各类方法的优势与缺陷,仔细深入的研究了各方法的原理及适用范围,然后针对现有的协同推荐算法因用户物品评分矩阵的稀疏性影响使推荐系统中的用户相似度计算不准确进而导致推荐质量不高这一问题,提出了基于降噪堆栈式自动编码机的协同过滤推荐算法(Stacked de-noising auto-encoders based collaborative filtering,简称SDAE-CF算法)。旨在将自动编码机引入到推荐系统中,使用自动编码机从用户物品评分矩阵中提取出用户的偏好特征辅助协同过滤推荐任务,提高推荐质量。本文的主要创新点有两点,总结如下:(1)将堆栈式降噪自动编码机引入到协同过滤推荐任务中用于学习用户偏好特征表示,将其作为协同推荐任务初始步骤中的一个重要组件,研究并提出基于降噪堆栈式自动编码机的协同过滤算法(SDAE-CF)。相对于传统的推荐算法中直接将系统全量商品数目作为用户偏好模型的特征维度,本文方法在空间上大大的减少了用户偏好特征表示所需要的维度,得到相对稠密的用户特征向量,为适应于推荐任务场景,对原型的自动编码机的结构和训练策略进行改造,首先在结构上引入噪声模型并进行堆栈,强化了自动机编码提取特征的能力,其次在训练策略上,对共同评分用户进行紧耦合的同步训练方式,减少了超参数的数目,降低针对单个用户的个性化自动编码机的训练难度。(2)在妥协一定准确性的前提下,提出以改进的汉明距离作为用户特征向量的相似度计算方法,使用户之间的相似度计算变得简洁高效,并与采用其他相似度标准计算所得的推荐结果进行比较,实验证明使用该方法作为用户间的相似度计算标准仍然可以达到较好的推荐性能。综上,本文通过在协同过滤推荐任务中引入自动编码机来构建基于堆栈式降噪自动编码机的协同过滤模型,该模型有效的缓解了推荐系统中由评分矩阵过于稀疏引起的相似度计算不可靠、推荐精度下降的问题。另外,本文提出的算法模型在隐性反馈的数据集上针对Top-N推荐任务具有较好的扩展性。在MovieLens电影评分数据集上的实验结果表明了SADE-CF算法的有效性。
其他文献
幼儿生活自理能力是其独立性发展的第一步,是保证孩子全面发展的基础素质之一,2-4岁是儿童生活自理能力和良好生活习惯初步养成的关键期,如何把握好这个时期至关重要。而家长
合成了硝酸正丁胺和醋酸正十二胺两种胺型离子液体,考察了它们与交联型聚醚破乳剂NJ-20复配产生的破乳脱水作用。结果表明,50℃、复配型破乳剂加入量为200 mg/L时(100 mg/L聚
分别以二氯甲烷和乙醚作溶剂,采用低温冷凝,同时蒸馏萃取南方红豆杉干叶挥发性成分,极性色谱柱(DB-WAX)气-质联机分析。鉴定出63种化合物,主要是脂肪族类(39种),其次为芳香族
现代油气勘探研究高度依赖各类计算机应用系统,油气勘探私有云通常成为油气田企业科研生产基础平台,对油气勘探私有云运维管理提出较高要求。在推行IT服务管理提高油气勘探私
<正>对于"全面从严治党"和"主体责任",人们并不陌生。而将两者放在一起这一看似简单的组合,却明确回答和强调了全面从严治党谁来抓、谁来负责、谁是第一责任人的重大问题,对
网络教育正在引发一场教育史上的革命,在我国发展网络教育很有必要。本文介绍了网络教育在我国的现状、需要解决的一些问题及对策。
由于集成电路和印制电路板中存在大量异材连接,器件发热而导致材料的热变形和热疲劳失效,进而产生热力耦合可靠性问题。半导体器件的工作温度是由器件的耗散功率、环境温度及散
以碳酸二乙酯和乙二胺为原料,气固相催化合成N-乙基乙二胺。考察了不同催化剂(丝光沸石、β沸石、Y分子筛)、碱金属(Li、Na、K)离子改性的催化剂和反应条件对该烷基化反应的
目的:分析冠心病患者在支架植入术后中医证素的分布情况及变化趋势,并剖析各中医证素与年龄、性别、个人史、合并症等之间的相关性。方法:(1)以2018年1月-2019年3月在长春中医药大学附属医院及吉林大学白求恩第一医院心内科疗区住院患者为研究对象,经冠脉造影诊断冠心病,并接受PCI术治疗的患者,共计314例。(2)以接受冠脉介入术前1-2天及术后3天为时间点,对314例患者冠脉支架植入前后进行病史、
<正> _本文探讨单中心城市离心型就业模式的居住、工作区位和通勤模型。我们得知,同等家庭依据各自就业人员的工作区位而选择不同的居住区。这就是说,就业人员在中心商业区工