论文部分内容阅读
随着互联网行业和大数据技术的飞速发展,网络信息资源急剧增加,一方面使越来越多的人享受到了信息革命带来的方便和快捷,另一方面也使得信息过载成为大数据时代新的挑战。对于用户来说,如何在日益增长的数字信息资源中找到自己所需的内容是一件重要但非常困难的事情。对于服务提供商来说,如何准确地为用户提供合适的商品或服务,满足用户的需求,从而提高服务质量,也是一件富有挑战性的事情。推荐系统的出现在很大程度上缓解了这些难题。它作为一种信息过滤的有效手段,可以根据用户的基本信息或历史浏览记录,预测用户的兴趣偏好,帮助用户从大量选择中更加快速地选出自己感兴趣的商品或服务。推荐系统能够为用户提供个性化的服务,提升用户体验,加强用户和服务提供商的交互性。现如今互联网上的信息资源越来越多,个性化推荐系统的价值也越来越高。传统的推荐系统通常利用用户的评分、浏览历史记录或者用户、项目的基本信息,但是,在很多现实场景中并不一定能获得好的推荐结果。例如用户在未登录的状态下点击了一些项目,此时推荐系统想要预测用户接下来点击的项目,但唯一可用的信息是匿名行为序列。传统的推荐算法在其他信息未知时并不适用,基于会话的推荐就是在这种情况下被提出的。近些年来,在基于会话的推荐任务中,循环神经网络的应用已经引起了广泛关注,并且显示了一定的优势。循环神经网络利用每一层的隐藏状态存储用户的信息,当前时刻的隐藏状态是由前一时刻的隐藏状态和当前的输入来决定的。这使得它能够建模当前会话的序列行为模式,而且有助于学习用户的短期偏好。但是,以前基于循环神经网络的模型在为会话做推荐时,往往只着眼在当前会话中,忽略了邻居会话中包含的协同信息的价值。邻居会话指的是在此之前由其他用户生成的,与当前会话具有相似用户意图的会话集合。我们猜测这类邻居会话中包含的协同信息可以帮助提高当前会话推荐的性能。为此,在本文的研究工作中,我们提出了一种新的混合框架——协同会话推荐机,这可以将协同邻域信息应用到基于会话的推荐系统中。协同会话推荐机由两个并行模块组成:一个内部记忆编码器和一个外部记忆编码器。具体来说,内部记忆编码器利用循环神经网络和注意力机制来建模当前会话中用户自身的信息。而外部记忆编码器借助了邻居会话中包含的协同邻域信息,可以更好地预测用户在当前会话中的意图。然后,模型为了获得当前会话的最终表示,引入了一个融合门机制,选择性地结合内部记忆编码器和外部记忆编码器内的信息。最后,通过计算当前会话的最终表示和每个候选项目表示的双线性匹配函数值,模型得到了所有候选项目的推荐分数。为了证明本文提出的算法的有效性,我们在三个公开可用的数据集上进行了大量的对比实验。实验结果表明,与之前最先进的基于会话的推荐算法相比,本文的协同会话推荐机模型在Recall@20和MRR@20两个评价指标上都取得了明显的性能提升。除此之外,我们还分析了协同会话推荐机模型的推荐过程,详细展示了模型中采用的协同邻域信息和融合门机制何时以及如何对推荐性能产生正面积极的影响。