基于确定性因子模型的混合电影推荐算法研究

来源 :南开大学 | 被引量 : 0次 | 上传用户:qwaxjl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
因特网的迅猛发展使大规模的数据共享成为了可能,随之而来的还有数据爆炸式增长所导致的信息过载问题。推荐系统便是在这样的情况下应运而生,它的出现使用户潜在感兴趣的信息能够被推送到用户面前。推荐系统的研究始于20世纪90年代初期,至今已衍生出基于内容推荐、协同过滤推荐等不同的分支,如今推荐系统的应用领域已涵盖了电子商务、电影推荐、邮件个性化排序等诸多方面,众多网站纷纷建立了自己的推荐系统,在不同程度上向用户提供着个性化推荐服务。  确定性因子(Stanford certainty factor,SCF)理论,是利用确定性因子处理不确定性的方法,SCF模型已被用于推荐系统并取得了令人满意的成绩,该模型具有以下优势:(1)其应用无需以数据分布遵循特定的规则为前提;(2)支持从多角度分析用户兴趣,降低稀疏矩阵所造成的影响,且推荐结果的可解释性较强。然而基于SCF模型的推荐算法仍存在一定的局限性,主要体现为:(1)基于SCF模型的推荐算法,其预测函数在各候选分值上的取值为各组确定性因子计算结果的简单加和,若因子之间存在不同程度的耦合,SCF模型可能难以平衡各因子的作用,使某些因子的影响力无法得以发挥。因此,基于SCF的推荐算法对因子的选择与组合有着较严格的限制,需保证不同的因子之间基本相互独立,这便导致算法的设计工作受到一定的束缚;(2)各组因子计算结果的分布可能存在一定甚至较大的差异,对于不同的因子组合,基于SCF的推荐算法始终令所有因子以默认的比例系数对最终的预测结果产生影响,这样的做法一方面在某些情况下无法准确模拟实际应用中的因子作用情况,另一方面亦无法使算法在不同的因子组合之间实现灵活的转换;(3)各组因子在用户评分决策过程中的影响程度未必是恒定的,不同用户评价电影时的侧重点通常有所区别,而原始的SCF模型无法准确反映这样的区别。  文中针对SCF模型存在的问题提出了改进的方向,即在SCF模型的基础上,对预测函数中的不同因子进行加权,并利用机器学习技术确定各因子的权重,使之能够更准确地区分并拟合不同用户的评分行为,有效地提高了算法的预测准确度。  本文首先总结了一些现有的推荐技术以及其优缺点,并介绍了SCF模型及其在个性化推荐领域所面临的挑战,从而以此为基础提出了基于Weighted-SCF模型的推荐算法,并详细介绍了该算法的设计思路和实现方法。最后通过实验对本文所提出的改进思路进行验证并将改进后的模型与当前主流的推荐模型进行了对比。实验结果表明,改进后的算法在电影的个性化推荐领域取得了更好的结果,并有着优于主流推荐算法的表现。
其他文献
近年来,随着互联网的飞速发展,网络技术的不断进步,想要在现有的网络上进行一些创新性试验也随着变得越来越困难。针对这种情况,斯坦福大学提出了基于控制与转发分离思想的新
随着数字多媒体和互联网技术的高速发展,数字媒体的发布和传播变得越来越简单和快捷。由于数字媒体传播的快捷性和篡改的简易性,使得发行商和服务提供商陷入版权危机,直接影
近年来,随着计算机的引入,使得地震资料的处理及可视化得到了很大的发展。一些非常规数学方法,如神经网络,小波变换,模糊数学,分型几何学等也在地震数字处理方面取得了一定的
信度网被认为是目前最有竞争力的一种不确定知识的表达方式,它以结点表示状态,以有向边表示结点间的相互依赖关系,用条件概率表(CPT)表达结点间依赖关系的强弱.基于这样的独
当前,宇航产品研制任务密度高、研制周期不断缩短,如何提高产品设计效率、保证设计质量成为亟待解决的问题。宇航产品设计过程对知识高度依赖,设计人员需要准确、及时、高效的获
近年来,随着科研项目规模的不断扩大,科研领域产生的数据量急剧膨胀。这预示着科研正在步入大数据时代。大数据科研为当前的科学计算提出了一个新的挑战:处理和分析这些数据需
近年米,以IPTV为代表的视频类业务越来越受到电信运营商的重视,移动终端视频类业务也愈加普及,不断改变人们的生活方式。在这个以用户为中心的时代,用户是否满意是视频业务提
学位
嵌入式技术随着后PC时代的到来得到了迅猛的发展,人才缺口较大。《嵌入式系统》是一门实践性很强的课程,其实验设备更新换代快、投入大,一些高校无力提供足够的实验设备。而
一直以来,如何快速地从空间数据中提取更加丰富和有用的信息,为人们有效地管理和利用空间数据提供信息决策参考是空间分析研究人员的目标。随着全球范围测量精度的不断提高,