【摘 要】
:
在互联网迅猛发展的同时,人类所获得的信息资源的数量也在急剧增长。面对这个信息过载的互联网时代,为了帮助人类快速有效地筛选出有用的信息数据,推荐系统应运而生。推荐系统的核心是推荐算法。在众多的推荐算法中,协同过滤(Collaborative filtering,CF)算法是目前推荐系统经常使用的算法之一。CF算法首先通过搜集用户的过去行为数据来发现用户的个人喜好,然后根据用户喜好的不同对用户进行分组
论文部分内容阅读
在互联网迅猛发展的同时,人类所获得的信息资源的数量也在急剧增长。面对这个信息过载的互联网时代,为了帮助人类快速有效地筛选出有用的信息数据,推荐系统应运而生。推荐系统的核心是推荐算法。在众多的推荐算法中,协同过滤(Collaborative filtering,CF)算法是目前推荐系统经常使用的算法之一。CF算法首先通过搜集用户的过去行为数据来发现用户的个人喜好,然后根据用户喜好的不同对用户进行分组,最终推荐给目标用户符合其喜好的项目。然而,随着电商网站中用户数量以及项目数量指数式增长,数据稀疏性问题、可扩展性问题、计算量大、推荐结果不准确以及实时性差等问题渐渐成为CF算法发展的制约因素。本文首先介绍了推荐系统的发展背景、工作原理以及几种经常使用的推荐算法,对其中的CF算法进行详细描述,深入研究了CF算法的基本思想、工作流程、优点缺点以及评价标准,分析了当前CF算法面临的问题以及相应的解决方案。然后在用户聚类、矩阵数据填充方面,本文对传统的CF算法做了以下改进:(1)针对传统K-means算法随机选取初始聚类中心和k值,容易导致推荐结果不准确的问题。本文在现有的初始聚类中心选取改进工作的基础上,提出了一种改进的初始聚类中心和k值选取方法,该方法以最小生成树局部最优解的思想为基础,使用改进的Kruskal算法,进行用户聚类,生成k个用户簇,得到更加准确的用户聚类结果,从而有效地缓解了算法的可扩展性问题、用户冷启动问题,减少了计算量。(2)考虑到数据稀疏的问题,本文提出了一种改进的数据预填充算法,该算法在改进的Tanimoto系数(广义Jaccard系数)的基础上,得到了更合理的用户相似度,提出了新的预测公式,计算出目标用户对未评价项目的评分值,并将该值补充到用户相似度矩阵中,降低了矩阵数据的稀疏度。(3)采取层叠的组合方式将改进的K-means用户聚类算法与改进的数据预测填充算法进行有机结合,该组合算法同时解决了数据稀疏性问题、可扩展性问题、用户冷启动问题,降低了时间复杂度,提高了推荐精度。最后,本文以Movie Lens数据集作为实验数据进行实验,验证本文提出的改进的协同过滤算法的有效性和可执行性。
其他文献
檀香(Santalum album)是一种典型的珍贵树种,具有极高的经济价值和药用价值。它原产于澳大利亚、印度尼西亚等国家,近些年来在我国海南省推广种植,但由于管理模式粗放,同时也
导管架平台作为浅海和中深海区最常见的平台,在海洋石油资源的勘探与开发中发挥着巨大的作用。然而,在导管架平台安装和服役过程中,无法避免补给船、甲板坠物等对平台部分管状构件(如弦杆、撑杆、立柱等)造成撞击损伤,从而影响构件的承载能力,威胁到平台的运营安全。因此,研究导管架平台管状构件碰撞受损后的剩余强度对平台整体的安全性和稳定性都是至关重要的。本文以这类受力构件为研究对象,从实验、有限元和理论三个方面
随着人工智能在医疗领域中的广泛应用,通过自然语言处理技术,可以实现患者的发病史、诊疗过程和出院状况的智能化管理。将这些信息应用在智慧诊疗中,对构建医学知识图谱、辅助决策系统和问诊系统至关重要。针对当前电子病历命名实体识别准确率不高以及需要大量人工标注的问题,本文采用自注意力模型结合双向循环神经网络对命名实体识别进行研究,主要的工作包括:实验数据集采用全国知识图谱和语义计算大会开源的电子病历,对数百
船舶在海上航行时,砰击现象会时常发生,对于具有大外飘结构的船舶,即使底部结构不出水,波浪的砰击载荷也会作用于船艏部的船侧结构上产生较大的侧向载荷,可能导致船侧局部结构的破坏。与其他船体结构不同的是,首外飘的角度较大时,该部分的加强筋并非全部垂直于舷侧外板,而是与外板形成一定的角度。目前针对侧向载荷作用下加筋板的极限强度研究多注重于加强筋垂直于外板的情况,因此为了满足带倾角加筋板船侧结构的使用性能和
虹吸式出水流道因其断流方式方便可靠,在我国大型轴流式防洪排涝泵站中应用广泛。但随着水文地质条件的变化,在汛期外江水位超驼峰情况时常发生,在超驼峰水位下利用虹吸式出水流道已无法断流,直接影响到机组安全稳定运行。因此,本文针对广东某带虹吸式出水流道的轴流泵站在超驼峰工况下,机组启动、停机水力稳定性问题,基于瞬变流理论分析了超驼峰工况下轴流泵启停特性,提出了超驼峰工况下水泵-闸门联合控制策略,确定超驼峰
气凝胶作为一种功能性强、比表面积大、孔隙率高、化学稳定性好的新型多孔材料获得了人们的关注,并在医学、绝缘、和催化等多种领域中得到广泛应用。通常采用超临界干燥方法
2013年以来,我国经济进入新常态,强化逆周期调节成为经济工作的重点。随着宏观经济环境的不断变化,并购已成为企业寻求发展新动能、优化资源配置、进行战略调整的关键手段。近几年,煤电企业相继通过并购手段来进行逆周期布局,以期实现企业经济持续增长的目标。但现有研究发现,企业在逆周期进行并购重组对其经济增长的提升效果并不明显,具体表现为协同效应难以充分发挥,企业绩效普遍下降。因此,有必要对逆周期背景下企业
作为国际社会普遍认可的个人信息保护法的基本原则,目的限制原则基本含义包括目的明确和使用限制两方面的内容,目的明确要求信息控制者在进行个人信息收集之时,以特定、明确及合法的方式让信息主体知晓个人信息被收集和使用的目的,从而对个人信息的后续使用产生合理预期;使用限制则要求在个人信息的后续处理过程中,其处理方式不得逾越既定目的,除非符合其他法定行为规范,如出于公共利益、科学或历史研究或者统计目的之需要或
随着环保法规的日益严格,新的车用汽油标准对汽油中硫含量和烯烃含量以及苯含量提出了更高的要求,对高辛烷值清洁汽油调和组分的需求量逐年增加;另外随着芳烃下游产品需求量
伴随着互联网的普及,特别是新兴移动应用之间的泛在互连,各类数据呈现爆炸式增长,如何从中快速获取有用信息变得越来越难。在此背景下,推荐系统应运而生,在对抗信息过载问题方面扮演着重要角色。协同过滤(Collaborative Filtering)是构建推荐系统的关键技术之一,其核心思想是从“用户-物品”历史交互数据(如评分)中挖掘用户的潜在信息偏好,并据此为用户预测其未来可能感兴趣的物品。但是,相比于