面向社交评论文本的个性化推荐算法研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:nanfangjituan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的飞速发展,信息负载问题也变得愈发严重。个性化推荐算法对于提高平台流量转化率,促进智能经济,智能商业转型,以及促进经济生态的健康发展都具备重大意义。因此,研究个性化推荐算法已经成为一项非常重要的任务。在已有个性化推荐算法中,基于模型的协同过滤算法由于其出色表现受到广泛关注。该类算法的核心假设为用户和产品可以被表征在低维空间,并且可以基于用户和产品在低维空间中的表征计算其对应的评分。通常,用户和产品的交互数据被作为该类算法的输入数据,每个用户和产品在低维空间中的表征由其对应的历史交互数据决定。然而,由于推荐平台中用户产品交互数据非常稀疏和用户产品交互数据包含的信息比较单一且缺乏语义信息,导致该类推荐算法在推荐精准度和可解释性方面的表现存在不足。因此,针对解决个性化推荐算法中的数据稀疏性问题和推荐结果缺乏可解释性问题展开研究具有重要的研究意义和现实价值。随着在线社交平台的发展和智能设备的普及,越来越多的用户涌入在线社交平台,并在平台中分享个人日常生活中的点点滴滴,比如用户和产品的交互,用户对产品的评价,和用户和用户之间的社交关系等。因此,在线社交平台可提供非常多用户相关的数据,这些数据有助于分析用户的兴趣偏好和行为意图。考虑到数据丰富性,数据有效性,数据隐私性,以及评论文本天然的解释性等因素,本研究工作主要围绕两种用户相关的数据,即用户的社交关系数据和评论文本数据,针对解决个性化推荐算法中的数据稀疏性问题和推荐结果缺乏可解释性问题展开研究。按照个性化算法使用的数据进行划分,现有的相关工作可以分为两类,分别是基于社交关系的个性化推荐和基于评论文本的个性化推荐。对于基于社交关系的个性化推荐,已有的研究工作主要采用浅层线性模型建模用户的社交关系对用户兴趣偏好的影响。而真实场景中,用户之间的社交关系比较复杂,已有工作中的浅层线性模型难以建模用户之间复杂的社交影响力,导致基于社交关系的个性化推荐算法表现受限。对于基于评论文本的个性化推荐而言,已有的研究工作主要集中于如何消除评论文本中的语义歧义,而忽略了评论文本中的语义和用户行为意图之间的意图鸿沟。因此,如何基于用户的社交关系和评论文本提升个性化推荐算法的准确性和可解释性的仍然是一个值得探索的问题。本研究工作针对个性化推荐算法中的数据稀疏性问题和推荐结果缺乏可解释性问题,通过充分挖掘用户社交关系数据和评论文本数据,开展基于社交关系的用户兴趣偏好学习方法和基于评论文本的用户行为意图建模方法研究,具体而言,本文分别从三个方面展开研究,基于社交影响力传播的用户兴趣建模(建模社交用户之间的复杂影响力和提高推荐模型在精准性方面的表现),融合评论文本和评分数据对偶关系的推荐模型(消除评论文本和用户行为意图之间的意图鸿沟和提高推荐模型在精准性和可解释性方面的表现),基于无监督产品属性建模的可解释推荐模型(消除评论文本和用户行为意图之间的意图鸿沟和提高推荐模型在可解释性方面的表现):1、基于社交影响力传播的用户兴趣建模:本研究旨在建模社交用户之间的复杂影响力并提高推荐模型在精准性方面的表现。针对社交推荐场景中社交影响力迭代传播不可见问题,提出基于社交影响力传播的用户兴趣建模方法。本研究关键假设在于,因为受到社交邻居的影响,用户的兴趣偏好会发生变化。基于该假设可以发现,随着时间推移,每个社交用户的兴趣偏好将不断发生变化,直到趋于稳定。对于趋于稳定的社交用户而言,其对应的兴趣偏好不仅受到一阶邻居的影响,还同时受到高阶邻居的影响。社交用户的兴趣偏好随时间发生变化的过程也可以被看做是社交网络中信息传播的过程。借助图卷积网络对图结构中信息传播的建模能力,本研究工作结合图卷积网络建模社交用户兴趣偏好变化过程。相对于已有的浅层线性社交推荐模型,本研究工作提出的模型在评分预测任务上取得了更好的表现。2、融合评论文本和评分数据对偶关系的推荐模型:本研究旨在消除评论文本和用户行为意图之间的意图鸿沟和提高推荐模型在精准性和可解释性方面的表现。针对基于评论文本的推荐场景中评论与评分信息关联性复杂问题,提出融合评论文本和评分数据对偶关系的方法。评论文本表达了用户对商品不同属性的使用感受,在基于评论的个性化推荐算法中,评论文本一般被用来增强用户的兴趣偏好表征。更加精准的用户的兴趣偏好表征也将提升个性化推荐算法在评分预测任务上的表现。换言之,如果个性化推荐模型在评分预测任务上取得了更好的表现,表明评论文本和用户行为意图之间的意图鸿沟问题得到了缓解。通常评分预测模型仅将用户产品评分数据作为标签数据。由于推荐平台中用户产品评分数据较为稀疏,本工作引入更多的约束信号对基于评论文本的个性化推荐模型进行训练。在用户对产品进行评价时,一般伴随着评论和评分两种行为。基于用户的两种行为可以构建两个对偶任务,评分预测任务和评论文本生成任务。受对偶学习概念启发,可以发现这两个任务对应的模型满足概率对偶关系。通过将概率对偶关系转为约束项,并对两个任务对应的模型进行训练,可以提升推荐模型在推荐精准性和可解释性方面的表现。从而实现了缓解评论文本和用户意图之间的意图鸿沟问题。3、基于无监督产品属性建模的可解释推荐模型:和上一个工作一致,本工作旨在消除评论文本和用户意图之间的意图鸿沟。同上一个工作不同的是,本研究更专注于如何基于评论文本中产品的属性信息,训练细粒度可解释性文本生成模型,提高推荐模型可解释性。针对基于文本生成的可解释推荐场景中的评论文本自身多噪声问题,提出基于无监督产品属性建模的可解释推荐方法。由于用户撰写的评论包含大量和解释用户行为意图无关的文本,且缺乏真实的属性数据,本工作采用了一个无监督的属性抽取模块实现对评论文本中属性信息的抽取。结合无监督属性抽取模块,可以基于用户和产品的历史评论将用户产品表征在属性空间,并基于用户和产品在属性空间中的表征设计评分预测模块和可解释性文本生成模块。为了提高上述各个模块的表现,本工作设计一个统一的框架对上述模块进行联合训练,可以使得上述模块在训练阶段两两增强。训练得到的评分预测模块和可解释性文本生成模块在评分预测任务上和可解释性文本生成任务上均取得了不错的表现。这也意味着评论文本和用户行为意图之间的意图鸿沟问题得到了缓解。总而言之,为解决传统基于模型的协同过滤算法的数据稀疏性和推荐结果缺乏解释性两个问题,本研究工作基于用户的社交关系和评论文本数据,针对现有研究工作设计的浅层线性模型无法建模复杂的社交关系以及忽略了评论文本的语义和用户行为意图之间的意图鸿沟问题,结合数据挖掘领域中用户兴趣偏好和行为意图建模,社交网络分析,文本分析,以及机器学习领域中图卷积网络,对偶学习,多任务学习等技术研究和理论发展,对如何提高用户的个性化推荐算法的精准性和可解释性展开研究。在多个真实数据集中的实验表明,本研究工作提出的推荐模型在评分预测准确性和推荐结果可解释性方面均取得了较好的表现。
其他文献
目的:研发与规范医疗废物分类、收集、交接、贮存、运送、处置等环节的全流程医疗废物管理系统,利用信息技术加强医疗废物的闭环管理。方法:根据国家及江苏省相关法律法规对“医疗废物管理(监管)系统”的要求,结合临床实际情况,充分运用互联网、物联网、云计算等技术,建立和优化医疗废物管理系统。结果:对某三甲医院应用此系统前后,随机抽样调查45个部门的医疗废物闭环管理情况,发现医疗废物暂存时间、鹅颈式封口、计重
<正>随着我国经济的发展和人们观念的改变,人们已经习惯通过按揭的方式进行消费,我国的消费信贷得到蓬勃发展,消费信贷增长迅速。国家为了拉大内需,出台了很多政策来支持消费信贷的发展,人们生活习惯和消费习惯的改变使人们对消费品需求增加,消费信贷成为银行比较主要的贷款品种。我国商业银行在大力发展消费信贷的过程中,也出现了很多问题主要体现在经营管理和风险管控等方面,所以我国商业银行在市场营销、产品管理、风险
期刊
西安市以“‘四区一港两基地’+西咸新区”八大开发区,为其经济发展提供了关键支撑,然而,上述开发区在产业布局方面的矛盾日益突出。基于此,本文通过梳理各开发区产业定位与布局现状,以及对比各开发区各产业发展的实际情况后发现,各开发区主要面临主导产业定位与其优势产业存在一定偏差、产业空间布局仍存在一定程度的相互重叠等突出问题。为此,本文建议进一步明确各开发区产业发展定位,不断优化开发区产业空间布局。
针对冲出装饰扣产品口部向内卷边的圆环状扣位的难点,设计了一套多工位级进模具。为了冲出产品口部约3/4圆周的扣位,分3个工位冲压产品上的扣位,每个工位冲出扣位的1/3,每个扣位工位上的工序模由斜顶块、T形导轨、凹模、橡胶块、顶杆和氮气弹簧组成,由氮气弹簧推动斜顶块脱模。为了提升级进模具的工作效率、节省原材料,采用一出二的多工位级进模具。为了顺利提起料带,采用抬料销、弹簧销钉和导正销相结合的抬料结构,
数字控制技术在智能制造中起着非常重要的作用,掌握先进的数字控制技术可以使智能生产发展得更快、更全面,这对我国产业的智能化转型,提高各产业的智能化技术具有重要意义。本文分析了数字控制技术与智能制造的关系,详细论述了数字控制技术在智能制造中的应用和发展,希望能为我国的数字化、智能化企业提供参考。
桩基工程属于隐蔽工程,桩质量直接影响到整个工程的安危,需要进行桩身质量检测及质量缺陷处理。本文以珠海深厚软土地区的灌注桩为研究背景,采用声波透射法和和钻芯法对灌注桩进行综合检测,能够准确判定桩身存在的缺陷程度和缺陷位置,并针对该灌注桩桩身质量问题,运用新型帷幕复合注浆法,在桩周增加旋喷桩形成止水帷幕后,进行复合注浆施工,能够显著提升加固效果。
目前的生产方式对商用车纵梁存储和分拣排序的效率、电泳后纵梁的保护以及对纵梁的存储提出了更高层次的要求。纵梁智能化存储方案经过进一步开发和优化,解决其方案中遇到的难点和问题后,必然在未来的生产中会发挥极其重要的作用。
目的 观察心衰合剂对慢性心力衰竭患者认知功能及焦虑抑郁状态的影响。方法 选择2018年12月—2021年12月北京中医医院顺义医院心血管内科住院的慢性心力衰竭患者62例,分为治疗组31例、对照组31例。对照组给予西医常规治疗,治疗组在西医常规治疗基础上给予心衰合剂,疗程2个月。比较2组治疗前、治疗1个月、治疗2个月健康问卷-9项(PHQ-9)量表评分、广泛焦虑问卷-7项(GAD-7)量表评分、简易