推荐系统精度提高的实用方法

来源 :上海大学 | 被引量 : 0次 | 上传用户:ddlin2121
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
推荐系统的目的是向用户推荐用户感兴趣的信息和商品。推荐系统工具和技术是现有商业和研究团体的主要研究课题之一,推荐系统通过滤信息后台预言用户是否会对一个特定项目感兴趣,并据此向用户提供建议。推荐系统提供的建议主要用于用户的决策过程,例如买什么商品,听什么音乐,或读什么新闻。最近十年出现了许多推荐技术,大多数已经成功地在商业环境里被使用了。  希望使用推荐系统的系统设计师需要在多个候选系统之间进行选择。选择适当的推荐算法的第一步是确定应用程序要关注的属性。事实上,推荐系统有一套属性,可能会影响用户的体验,如精度、坚固性、可测量性等等。  协同过滤(CF)和基于内容的过滤(CBF)的推荐系统存在潜在问题,如稀疏性,覆盖范围小,冷启动,以及过于专业化。这降低了系统的有效性。组合推荐系统通过结合使用不同的建议方法克服了一些上述的问题。我们提出了一种新型的交换组合推荐建议算法,使用基于项目的CF和基于用户的CF上的分类方法生成受过训练的内容配置文件。交换组合推荐系统的智能点在于使用了一些标准来交换推荐方法。交换组合推荐系统的好处是,它能充分利用所构成的推荐系统的优点和弱点来实现更有效的推荐方法。我们的推荐算法能给出比传统的组合推荐系统更精确的结果。我们用MovieLens(SML)和FilmTrust(FT1)数据集评估该算法,实验表明,该算法在平均绝对误差,感受性曲线,覆盖范围三个方面都优于其他推荐系统,同时相对其他推荐系统还能消除一些记录问题并能在冷启动情况下保持稳健性。  更进一步,通过机器学习分类器和协同过滤(CF)方法之间的切换,该算法可以平衡推荐的精确性和多样性。如果系统建立了一个活跃用户的Top-N推荐名单,该算法还能在推荐列表中引入某种随机性,从而实现推荐一些在一定的范围内的代替品而不是项目组均匀的功能,本文用MAE平均绝对误差和感受性曲线ROC-sensitivity两种不同算法的覆盖范围对该算法进行了分析,结果表明该算法优于其他推荐算法的MAE平均绝对误差和感受性曲线ROC-sensitivity,并且比其他算法在覆盖度更好。这表明,该算法的扩展性和实用性很强,而由于我们使用的是基于项目的CF,其在线成本低于基于用户的CF,所以该算法的在线成本将小于或等于其他算法。
其他文献
企业应用集成(EAI)技术是一个非常广泛的议题,它主要是实现并简化异构系统间的互连,解决目前大型企业各类应用迅速增加但应用之间缺乏有效通信的问题。EAI技术在许多行业如电信
数据挖掘是数据库研究领域中最活跃的分支之一,在科学研究和银行、电信、保险、零售等应用领域都取得了很多的成果。但数据挖掘也带来了一些社会问题,尤其是信息安全和隐私保护
随着语义网络技术的发展,越来越多的领域运用本体来描述领域内的知识。比如,本体被用于生物工程来描述基因信息,被用于企业内部来描述企业的各种资源,也被用于金融行业来描述
摘要:云计算是伴随着互联网技术的进步而产生的一种以服务的方式提供动态可伸缩的虚拟资源的新型的计算模式。随着云计算的发展,科学工作流将逐渐在云计算中得到应用,目前越来
时间序列分类是时间序列研究的关键部分,为了高分类的准确率以及算法执行的效率,本文出了基于特征采样的时间序列分类方法。时间序列数据往往具有不等长的特性,常规的机器学
随着信息网络技术的飞速发展,传统图书馆的服务已远不能满足人们对知识的需要,特别是在信息服务和知识服务方面。图书馆数字化的逐步推进,让人们能更加快速、准确的获取所需
组推荐算法弥补了传统推荐算法无法给多个人进行推荐的缺点,已经引起了越来越多的研究者的关注。目前的组推荐算法主要分为两种,一种是使用组偏好模型进行推荐,另一种是融合组员
公钥基础设施PKI以非对称加密技术为基础,为网络信息安全提供有力保障。PKI以数字证书为密钥管理工具,终端实体之间进行通信之前必须要验证数字证书的可信性。验证数字证书是否
随着多媒体技术和计算机网络的飞速发展,数字媒体的制作和传播变得更加方便和快捷,同时,盗版和侵权的问题也日益严重。数字水印技术作为一种数字媒体版权保护的有效方法,近年
人脸检测是指通过对输入图像进行分析,确定其中人脸的数目、大小、位置、姿态等信息的过程。人脸检测作为人脸识别的先期工作,是计算机模式识别领域研究热点,涉及模式识别、图像