论文部分内容阅读
随着互联网的飞速发展,信息负载问题也变得愈发严重。个性化推荐算法对于提高平台流量转化率,促进智能经济,智能商业转型,以及促进经济生态的健康发展都具备重大意义。因此,研究个性化推荐算法已经成为一项非常重要的任务。在已有个性化推荐算法中,基于模型的协同过滤算法由于其出色表现受到广泛关注。该类算法的核心假设为用户和产品可以被表征在低维空间,并且可以基于用户和产品在低维空间中的表征计算其对应的评分。通常,用户和产品的交互数据被作为该类算法的输入数据,每个用户和产品在低维空间中的表征由其对应的历史交互数据决定。然而,由于推荐平台中用户产品交互数据非常稀疏和用户产品交互数据包含的信息比较单一且缺乏语义信息,导致该类推荐算法在推荐精准度和可解释性方面的表现存在不足。因此,针对解决个性化推荐算法中的数据稀疏性问题和推荐结果缺乏可解释性问题展开研究具有重要的研究意义和现实价值。随着在线社交平台的发展和智能设备的普及,越来越多的用户涌入在线社交平台,并在平台中分享个人日常生活中的点点滴滴,比如用户和产品的交互,用户对产品的评价,和用户和用户之间的社交关系等。因此,在线社交平台可提供非常多用户相关的数据,这些数据有助于分析用户的兴趣偏好和行为意图。考虑到数据丰富性,数据有效性,数据隐私性,以及评论文本天然的解释性等因素,本研究工作主要围绕两种用户相关的数据,即用户的社交关系数据和评论文本数据,针对解决个性化推荐算法中的数据稀疏性问题和推荐结果缺乏可解释性问题展开研究。按照个性化算法使用的数据进行划分,现有的相关工作可以分为两类,分别是基于社交关系的个性化推荐和基于评论文本的个性化推荐。对于基于社交关系的个性化推荐,已有的研究工作主要采用浅层线性模型建模用户的社交关系对用户兴趣偏好的影响。而真实场景中,用户之间的社交关系比较复杂,已有工作中的浅层线性模型难以建模用户之间复杂的社交影响力,导致基于社交关系的个性化推荐算法表现受限。对于基于评论文本的个性化推荐而言,已有的研究工作主要集中于如何消除评论文本中的语义歧义,而忽略了评论文本中的语义和用户行为意图之间的意图鸿沟。因此,如何基于用户的社交关系和评论文本提升个性化推荐算法的准确性和可解释性的仍然是一个值得探索的问题。本研究工作针对个性化推荐算法中的数据稀疏性问题和推荐结果缺乏可解释性问题,通过充分挖掘用户社交关系数据和评论文本数据,开展基于社交关系的用户兴趣偏好学习方法和基于评论文本的用户行为意图建模方法研究,具体而言,本文分别从三个方面展开研究,基于社交影响力传播的用户兴趣建模(建模社交用户之间的复杂影响力和提高推荐模型在精准性方面的表现),融合评论文本和评分数据对偶关系的推荐模型(消除评论文本和用户行为意图之间的意图鸿沟和提高推荐模型在精准性和可解释性方面的表现),基于无监督产品属性建模的可解释推荐模型(消除评论文本和用户行为意图之间的意图鸿沟和提高推荐模型在可解释性方面的表现):1、基于社交影响力传播的用户兴趣建模:本研究旨在建模社交用户之间的复杂影响力并提高推荐模型在精准性方面的表现。针对社交推荐场景中社交影响力迭代传播不可见问题,提出基于社交影响力传播的用户兴趣建模方法。本研究关键假设在于,因为受到社交邻居的影响,用户的兴趣偏好会发生变化。基于该假设可以发现,随着时间推移,每个社交用户的兴趣偏好将不断发生变化,直到趋于稳定。对于趋于稳定的社交用户而言,其对应的兴趣偏好不仅受到一阶邻居的影响,还同时受到高阶邻居的影响。社交用户的兴趣偏好随时间发生变化的过程也可以被看做是社交网络中信息传播的过程。借助图卷积网络对图结构中信息传播的建模能力,本研究工作结合图卷积网络建模社交用户兴趣偏好变化过程。相对于已有的浅层线性社交推荐模型,本研究工作提出的模型在评分预测任务上取得了更好的表现。2、融合评论文本和评分数据对偶关系的推荐模型:本研究旨在消除评论文本和用户行为意图之间的意图鸿沟和提高推荐模型在精准性和可解释性方面的表现。针对基于评论文本的推荐场景中评论与评分信息关联性复杂问题,提出融合评论文本和评分数据对偶关系的方法。评论文本表达了用户对商品不同属性的使用感受,在基于评论的个性化推荐算法中,评论文本一般被用来增强用户的兴趣偏好表征。更加精准的用户的兴趣偏好表征也将提升个性化推荐算法在评分预测任务上的表现。换言之,如果个性化推荐模型在评分预测任务上取得了更好的表现,表明评论文本和用户行为意图之间的意图鸿沟问题得到了缓解。通常评分预测模型仅将用户产品评分数据作为标签数据。由于推荐平台中用户产品评分数据较为稀疏,本工作引入更多的约束信号对基于评论文本的个性化推荐模型进行训练。在用户对产品进行评价时,一般伴随着评论和评分两种行为。基于用户的两种行为可以构建两个对偶任务,评分预测任务和评论文本生成任务。受对偶学习概念启发,可以发现这两个任务对应的模型满足概率对偶关系。通过将概率对偶关系转为约束项,并对两个任务对应的模型进行训练,可以提升推荐模型在推荐精准性和可解释性方面的表现。从而实现了缓解评论文本和用户意图之间的意图鸿沟问题。3、基于无监督产品属性建模的可解释推荐模型:和上一个工作一致,本工作旨在消除评论文本和用户意图之间的意图鸿沟。同上一个工作不同的是,本研究更专注于如何基于评论文本中产品的属性信息,训练细粒度可解释性文本生成模型,提高推荐模型可解释性。针对基于文本生成的可解释推荐场景中的评论文本自身多噪声问题,提出基于无监督产品属性建模的可解释推荐方法。由于用户撰写的评论包含大量和解释用户行为意图无关的文本,且缺乏真实的属性数据,本工作采用了一个无监督的属性抽取模块实现对评论文本中属性信息的抽取。结合无监督属性抽取模块,可以基于用户和产品的历史评论将用户产品表征在属性空间,并基于用户和产品在属性空间中的表征设计评分预测模块和可解释性文本生成模块。为了提高上述各个模块的表现,本工作设计一个统一的框架对上述模块进行联合训练,可以使得上述模块在训练阶段两两增强。训练得到的评分预测模块和可解释性文本生成模块在评分预测任务上和可解释性文本生成任务上均取得了不错的表现。这也意味着评论文本和用户行为意图之间的意图鸿沟问题得到了缓解。总而言之,为解决传统基于模型的协同过滤算法的数据稀疏性和推荐结果缺乏解释性两个问题,本研究工作基于用户的社交关系和评论文本数据,针对现有研究工作设计的浅层线性模型无法建模复杂的社交关系以及忽略了评论文本的语义和用户行为意图之间的意图鸿沟问题,结合数据挖掘领域中用户兴趣偏好和行为意图建模,社交网络分析,文本分析,以及机器学习领域中图卷积网络,对偶学习,多任务学习等技术研究和理论发展,对如何提高用户的个性化推荐算法的精准性和可解释性展开研究。在多个真实数据集中的实验表明,本研究工作提出的推荐模型在评分预测准确性和推荐结果可解释性方面均取得了较好的表现。