论文部分内容阅读
随着电子商务的快速发展,网络购物在人们的生活中扮演着越来越重要的角色。然而随着商品的数量越来越多,用户从海量商品中寻找合适和喜爱的商品反而变得越来越困难,因此需要一种可以快速并准确地将用户喜爱的商品推荐给他们的工具,于是产生了推荐系统。推荐系统能根据用户的历史数据,向用户推荐他们感兴趣的信息和商品,帮助用户进行决策,从而提高决策效率和质量。 早期的推荐系统大多依赖于能够明确说明用户对物品兴趣的显式反馈。然而在现实应用中显式反馈是比较难获取的。而不直接说明用户兴趣的隐式反馈,比如用户转发微博、购买商品等交互行为,具有收集简单、不易引起用户反感等优点,因此越来越多的研究者开始研究基于隐式反馈的推荐方法。 现有的基于隐式反馈的方法只考虑了单种隐式反馈,然而大部分网站上都存在不止一种的隐式反馈,比如购买和点击行为,这些同时存在的多种不同的隐式反馈所表达的用户偏好是有差异的,具有异构性,因此被称为异构隐式反馈。此外隐式反馈还具有不确定性、用户偏好动态变化以及数据稀疏性等问题。针对以上问题,对基于异构隐式反馈的推荐问题展开研究,主要工作和贡献如下: 1)提出一种基于隐式反馈内在联系的异构隐式反馈用户偏好量化方法。针对异构隐式反馈的异构性和反映的用户偏好的不确定性问题,提出一种基于隐式反馈内在联系的异构隐式反馈用户偏好量化方法。在该方法中,首先对异构隐式反馈的特点进行分析,将隐式反馈分为“确定隐式反馈”和“非确定隐式反馈”,其中确定隐式反馈能够确定地反映用户偏好,因此可以直接进行量化;而非确定隐式反馈所反映的用户偏好程度是不确定的。本文提出通过挖掘确定隐式反馈和非确定隐式反馈之间的内在联系来刻画非确定隐式反馈的“确定性”,从而实现异构隐式反馈的用户偏好量化。该方法不需人为指定每种隐式反馈对用户偏好的贡献度,也不需要额外的显式反馈来训练模型。实验结果表明该方法能够更好地刻面异构隐式反馈反映的用户偏好,从而取得更好的推荐效果。 2)提出一种时间敏感的异构隐式反馈用户偏好量化方法。确定隐式反馈只能反映用户在行为发生的时候是喜欢该物品的,但是用户的偏好是动态变化的,过去的兴趣对用户后续的行为不一定有参考价值,刻画用户未来的兴趣才是关键。因此,除了异构性和不确定性外,还针对用户偏好的动态变化特性,提出一种时间敏感的异构隐式反馈的用户偏好量化方法,通过建立历史异构隐式反馈(包括确定隐式反馈)与未来发生确定隐式反馈之间的联系来量化用户未来的偏好。实验证明该方法可以更好地抓住用户偏好的动态特性。 3)提出一种统一的样本选择方法和一种置信度计算方法。BPR(Bayesian Personalized Ranking)算法是一种流行的基于隐式反馈的推荐算法,其核心在于选择具有偏好优先级关系的“物品—物品”组合作为样本,并优化用户对物品的排序。在异构隐式反馈的场景下,BPR算法无法考虑不同类别的行为在反映用户偏好能力上的差异,也无法刻画对偏好排序的置信程度。此外BPR还存在稀疏性问题,即缺少有效的可比较的物品对作为样本。本文提出一种统一的样本选择方法来对异构隐式反馈场景下的用户偏好进行排序,解决异构隐式反馈的异构性问题,同时该方法能够选出更多有效的训练样本,解决稀疏性问题。此外,提出一种新的置信度计算方法,用置信度来刻画每个样本的重要性。实验表明,我们的方法比BPR算法及其最新的几个改进算法的效果更好。 4)提出一种基于隐式反馈转化路径特征的推荐算法。关联规则挖掘(Association rule mining)是一种常用的推荐算法。传统的基于关联规则的推荐算法只能同时处理单种行为的关联,无法处理异构隐式反馈的场景。针对异构隐式反馈的异构性问题,提出一种基于隐式反馈转化路径特征的推荐算法,解决异构隐式反馈场景下的关联推荐。该方法首先利用大量用户的历史隐式反馈数据,建立物品与物品之间存在的间接隐式反馈转化路径;然后从用户已交互过的物品出发,通过物品之间的链路到达新的物品。实验结果表明该方法可以取得较好的推荐效果。