【摘 要】
:
网络数据以每两年增长一倍的速度飞速增长,世界步入数据大爆炸时代。推荐算法为人们在纷繁浩杂的事物中找寻所需物品提供了一种解决方案,是缓解数据过载问题的有效方法之一。然而,推荐算法面临着三大挑战:数据稀疏、冷启动和可解释性问题。基于协同过滤的推荐算法作为目前应用最为广泛的推荐算法,通过对用户和商品的历史交互数据(包括评分数据、评论文本等)进行分析,从而建模用户和商品的隐藏特征,但仍存在上述问题。图神经
论文部分内容阅读
网络数据以每两年增长一倍的速度飞速增长,世界步入数据大爆炸时代。推荐算法为人们在纷繁浩杂的事物中找寻所需物品提供了一种解决方案,是缓解数据过载问题的有效方法之一。然而,推荐算法面临着三大挑战:数据稀疏、冷启动和可解释性问题。基于协同过滤的推荐算法作为目前应用最为广泛的推荐算法,通过对用户和商品的历史交互数据(包括评分数据、评论文本等)进行分析,从而建模用户和商品的隐藏特征,但仍存在上述问题。图神经网络发展成熟之后被逐渐应用于推荐算法之中,其结构的特殊性使其可以有效建模用户商品特征,有效缓解甚至解决推荐算法的三大挑战。引入图神经网络的推荐算法,虽然提高了可解释性,缓解了数据稀疏及冷启动问题,但目前大部分算法只是利用图神经网络提取用户商品之间的关系信息,而忽略了用户商品交互数据中的评分信息、评论文本等代表了用户商品关键特征的信息。为综合利用用户和商品的历史交互数据,更好地建模用户和商品的隐藏特征,从而提升推荐质量,本文基于图神经网络,结合传统深度学习的知识进行推荐算法研究,主要工作如下:1.更好地利用评论文本中富含的用户和商品的偏好信息,本文提出了基于图神经网络与深度学习的商品推荐算法。采用目前最流行的BERT模型处理评论文本信息,从中提取商品与用户的一般偏好,同时利用图神经网络与注意力机制来建模商品和用户的高阶连接性;然后,通过特征融合来获取商品和用户的最终特征表达;最后,采用点积操作来获得用户对相关商品的打分预测,并给出推荐。实验表明,该方法相比单独使用图神经网络的方法可以提高评分预测的质量,且推荐结果具备可解释性。2.评分矩阵富含用户对商品的偏好程度,是自然的权重分配表达。本文通过上述模型的改进,更好地利用了评分矩阵的权重指导作用。在建模商品和用户的高阶连接性时引入评分矩阵来指导注意力分配,同时在提取商品与用户的一般偏好时使用LSTM进一步提取用户商品的特征。在特征融合预测阶段将原有的点积评分预测更改为网络评分预测。实验表明,该方法相比上一方法进一步提升了评分预测的质量,同时降低了实验达到平衡所需的迭代次数。
其他文献
航空发动机孔探损伤自动检测技术是提高航空器飞行安全和利用率、节约时间和经济成本、促进智慧民航发展的一项重要内容。但孔探损伤自动检测技术的研究尚处于起步阶段,现有孔探数据存在损伤样本数量少,损伤类别分布不均衡的问题,因此,需要对进行数据扩展。目前尚无针对孔探场景的数据扩展方法。本文研究总结了通用场景的数据扩展方法,提出了基于风格迁移的交互式数据扩展方法和基于生成对抗网络的交互式数据扩展方法。论文工作
目的报道2例以节段性肌张力障碍为首发症状且发病年龄小于20岁的舞蹈病-棘红细胞增多症(chorea-acanthocytosis,Ch Ac),总结分析青少年起病的Ch Ac的临床特征,血涂片,影像学特征,基因特点以及基因型和表型的相互关系,增加对该疾病的认识。材料与方法本文报道了在本院确诊的2例Ch Ac,进行了家系及基因验证,检索回顾分析文献报道的确诊的青少年起病的Ch Ac,对疾病的临床特征
人工智能等技术的发展虽然为解决航班延误提供了新思路,但是因为航空系统的数据信息涉及机密,对他们各种计划制定都有着重要影响,数据高度敏感,各方之间数据难以共享,这给应用人工智能技术解决航班延误问题带来了巨大的挑战。因此,在隐私保护的前提下进行延误预测模型的建立显得愈发重要。根据现有的研究情况和存在的问题,本文进行了如下研究:针对现有的航班延误预测方法中未考虑多数据源与数据隐私问题,以及训练过程中中间
旅客大多数的不良情绪并不是因为航班延误本身引起的,而是由于在特殊天气条件之下,航空公司一直无法确定航班起飞时间,使得旅客做一些无谓的等待,造成旅客情绪不稳定,甚至出现恶性群体事件。论文结合海量气象数据对航班运行态势做量化研究,旨在对航班的运行态势做量化评估,做到提前预测航班运行态势,及时通知旅客航班是否能够正常运行,有利于旅客更好地安排行程,减少不必要的等待,从而减少乘客的焦虑和投诉。针对基于天气
目的探讨血清肿瘤坏死因子相关凋亡诱导配体(TNF-related apoptosis-inducing ligand,TRAIL)在细菌感染性疾病诊断中的价值。方法选取2020年8月11日-2021年2月5日在我院肝病感染科的住院患者,并根据出院诊断纳入诊断为感染性疾病的患者,分为细菌感染组和病毒感染组,排除非细菌和非病毒感染患者,选取同时期的医院健康体检人群作为对照组,记录研究对象基本信息和临床
知识图谱问答是知识图谱中的一个重要应用,近年来得到人们的广泛关注和研究。特别是针对复杂问题的知识图谱问答,由于问题中的关系和约束信息较多,以及面临知识图谱不完整等问题,都为当前研究带来了很大挑战。本文主要研究复杂问题的知识图谱问答,具体开展了以下工作:(1)知识图谱通常存在不完整的问题,导致问题主题实体和正确答案实体之间缺乏有效关系路径。前人提出使用知识嵌入方法实现链路预测,此类方法仅注重于将问题
目的:多巴胺(Dopaminergic,DA)神经元分化的潜在机制尚未完全阐明。本研究试图分析小鼠上胚层干细胞(Epiblast stem cells,Epi SCs)产生的外泌体中microRNA(miRNA)和mRNA的表达情况,揭示外泌体在DA神经元命运决定中的作用。方法:EpiSCs在添加了SHH和FGF8的N2B27培养基中增殖,通过单层分化(Monolayer differentiat
由于信用欺诈、网络入侵等异常的发生,异常检测被相关领域的众多国内外学者广泛关注,并已成为研究热点。目前已经提出了许多异常检测方法,其中基于聚类的异常检测方法最为流行。随着深度表示学习的发展,融合表示学习的聚类算法的性能具有了大幅提升。但是,现有的基于聚类的异常检测方法往往是根据聚类结果进行异常点检测,而在聚类过程中忽略了异常检测与聚类之间的相互依赖关系,从而导致异常检测准确度不高。为了提高异常检测
目的无功能性垂体神经内分泌肿瘤(NF-PitNETs)治疗困难。除手术外,对NF-PitNETs尚无有效的治疗方法。既往研究提示,MicroRNA-134(miR-134)可以抑制肿瘤细胞的增殖和侵袭能力。本文探讨了 miR-134在缓解NF-PitNETs肿瘤细胞生长中的作用及机制。方法在体外分别使用miR-134模拟物和抑制剂转染小鼠垂体瘤细胞系αT3-1细胞,然后再使用基质细胞衍生因子-1α
目的:骨肉瘤(OS)是由间充质细胞引起的常见骨肿瘤。在所有儿童和青少年中,骨肉瘤的死亡率最高。即使采用包括化学疗法在内的多种治疗方法,由于与转移和耐药性相关的肿瘤复发,其5年生存率仍低于70%。另外,尚未确定OS的有效治疗靶标或诊断标记,因此难以提高治疗效果。巨噬细胞迁移抑制因子(MIF)是一种多效细胞因子,作为炎症因子和致癌驱动蛋白,MIF在骨肉瘤微环境中起着至关重要的作用。虽然4-碘-6-苯基