基于异构隐式反馈的推荐问题研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:astanaZH
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子商务的快速发展,网络购物在人们的生活中扮演着越来越重要的角色。然而随着商品的数量越来越多,用户从海量商品中寻找合适和喜爱的商品反而变得越来越困难,因此需要一种可以快速并准确地将用户喜爱的商品推荐给他们的工具,于是产生了推荐系统。推荐系统能根据用户的历史数据,向用户推荐他们感兴趣的信息和商品,帮助用户进行决策,从而提高决策效率和质量。  早期的推荐系统大多依赖于能够明确说明用户对物品兴趣的显式反馈。然而在现实应用中显式反馈是比较难获取的。而不直接说明用户兴趣的隐式反馈,比如用户转发微博、购买商品等交互行为,具有收集简单、不易引起用户反感等优点,因此越来越多的研究者开始研究基于隐式反馈的推荐方法。  现有的基于隐式反馈的方法只考虑了单种隐式反馈,然而大部分网站上都存在不止一种的隐式反馈,比如购买和点击行为,这些同时存在的多种不同的隐式反馈所表达的用户偏好是有差异的,具有异构性,因此被称为异构隐式反馈。此外隐式反馈还具有不确定性、用户偏好动态变化以及数据稀疏性等问题。针对以上问题,对基于异构隐式反馈的推荐问题展开研究,主要工作和贡献如下:  1)提出一种基于隐式反馈内在联系的异构隐式反馈用户偏好量化方法。针对异构隐式反馈的异构性和反映的用户偏好的不确定性问题,提出一种基于隐式反馈内在联系的异构隐式反馈用户偏好量化方法。在该方法中,首先对异构隐式反馈的特点进行分析,将隐式反馈分为“确定隐式反馈”和“非确定隐式反馈”,其中确定隐式反馈能够确定地反映用户偏好,因此可以直接进行量化;而非确定隐式反馈所反映的用户偏好程度是不确定的。本文提出通过挖掘确定隐式反馈和非确定隐式反馈之间的内在联系来刻画非确定隐式反馈的“确定性”,从而实现异构隐式反馈的用户偏好量化。该方法不需人为指定每种隐式反馈对用户偏好的贡献度,也不需要额外的显式反馈来训练模型。实验结果表明该方法能够更好地刻面异构隐式反馈反映的用户偏好,从而取得更好的推荐效果。  2)提出一种时间敏感的异构隐式反馈用户偏好量化方法。确定隐式反馈只能反映用户在行为发生的时候是喜欢该物品的,但是用户的偏好是动态变化的,过去的兴趣对用户后续的行为不一定有参考价值,刻画用户未来的兴趣才是关键。因此,除了异构性和不确定性外,还针对用户偏好的动态变化特性,提出一种时间敏感的异构隐式反馈的用户偏好量化方法,通过建立历史异构隐式反馈(包括确定隐式反馈)与未来发生确定隐式反馈之间的联系来量化用户未来的偏好。实验证明该方法可以更好地抓住用户偏好的动态特性。  3)提出一种统一的样本选择方法和一种置信度计算方法。BPR(Bayesian Personalized Ranking)算法是一种流行的基于隐式反馈的推荐算法,其核心在于选择具有偏好优先级关系的“物品—物品”组合作为样本,并优化用户对物品的排序。在异构隐式反馈的场景下,BPR算法无法考虑不同类别的行为在反映用户偏好能力上的差异,也无法刻画对偏好排序的置信程度。此外BPR还存在稀疏性问题,即缺少有效的可比较的物品对作为样本。本文提出一种统一的样本选择方法来对异构隐式反馈场景下的用户偏好进行排序,解决异构隐式反馈的异构性问题,同时该方法能够选出更多有效的训练样本,解决稀疏性问题。此外,提出一种新的置信度计算方法,用置信度来刻画每个样本的重要性。实验表明,我们的方法比BPR算法及其最新的几个改进算法的效果更好。  4)提出一种基于隐式反馈转化路径特征的推荐算法。关联规则挖掘(Association rule mining)是一种常用的推荐算法。传统的基于关联规则的推荐算法只能同时处理单种行为的关联,无法处理异构隐式反馈的场景。针对异构隐式反馈的异构性问题,提出一种基于隐式反馈转化路径特征的推荐算法,解决异构隐式反馈场景下的关联推荐。该方法首先利用大量用户的历史隐式反馈数据,建立物品与物品之间存在的间接隐式反馈转化路径;然后从用户已交互过的物品出发,通过物品之间的链路到达新的物品。实验结果表明该方法可以取得较好的推荐效果。
其他文献
学位
学位
学位
面对月球信息数据的多源性和异构性等特点,需要一套准确、规范并且可互操作的信息描述格式对月球信息异构数据进行存储和管理,所以在本系统引入基于G/S(General-Brower/Distribu
随着Web技术的发展,越来越多的信息系统使用流行的B/S结构进行架构和开发。Web应用的开放性和流行性使得很多Web系统面临大量并发用户的使用,系统的可靠性和性能问题也随之出现
学者同名问题是学术搜索引擎下的一个常见问题,这给现代学术搜索引擎带来以下问题:第一不方便用户在众多同名作者中定位到自己感兴趣的作者;第二无法为学者建立一份个人研究档
虚拟植物的生长模型是精细化研究植物生长规律非常重要的方法,涉及到计算机信息科学、生态学、植物学、应用数学等多学科领域。传统的基于生理模型的虚拟植物生长模型对植物的
近年来,互联网的飞速发展大大促进了新技术的发展和普及。其中,人工智能技术的进展尤为迅猛,随着算法的不断完善,越来越多的智能设备开始进入我们的家庭生活中。这些智能设备普遍
在模糊专家系统,模糊控制,模糊决策支持系统与模糊模式识别等许多智能系统的开发研究中,常常会遇到许多具有模糊性的不确定信息与数据,为了表示和处理这些模糊的信息与数据,Zadeh
学位