【摘 要】
:
随着信息技术的发展,互联网为人们带来便利的同时也产生了信息过载的问题。协同过滤算法作为热门的推荐算法之一,它能极大地提高用户获取目标信息的效率,但该算法仍存在着数据稀疏性问题。为缓解这一问题,本文引入信任与评论等辅助信息,并围绕基于评论与信任关系的推荐算法展开研究。针对评论文本无法被充分挖掘、用户间直接信任关系稀疏及未考虑更多信息等问题,提出相应的解决方案。本文的主要工作如下:(1)构建了一个具有
论文部分内容阅读
随着信息技术的发展,互联网为人们带来便利的同时也产生了信息过载的问题。协同过滤算法作为热门的推荐算法之一,它能极大地提高用户获取目标信息的效率,但该算法仍存在着数据稀疏性问题。为缓解这一问题,本文引入信任与评论等辅助信息,并围绕基于评论与信任关系的推荐算法展开研究。针对评论文本无法被充分挖掘、用户间直接信任关系稀疏及未考虑更多信息等问题,提出相应的解决方案。本文的主要工作如下:(1)构建了一个具有三层注意力机制的混合推荐算法(Hybrid recommendation algorithm based on three-layer Attention Mechanism,HRA-TA),该算法首先用三层注意力机制从用户和项目的评论文本中学习得到用户和项目的深层表示,其次用矩阵分解从评分中学习得到用户和项目的浅层表示,最后将用户和项目的深层和浅层表示拼接作为用户和项目的最终表示用于预测评分。(2)本文认为有过对同一项目评分行为的两个用户间存在直接信任关系,提出了将皮尔逊相似性度量的用户偏好值作为用户间的直接信任值,并改进了信任传播得到用户间新的信任值。(3)现有的大多推荐算法在缓解数据稀疏性问题时,未同时考虑用户的评论和信任信息。本文将新的信任关系和基于BERT(Pre-training of Deep Bidirectional Transformers for Language Understanding)方法得到的项目评论文本融合在概率矩阵分解方法中,最终生成推荐算法(Probabilistic Matrix Factorization Recommendation Algorithm Combining Trust Relationship and Review Text,TRPMF)。在亚马逊提供的Office Products、Toy and Games、Kindle Store和Movies&TV四个数据集以及Yelp点评网站提供的Yelp数据集进行了实验,结果表明,数据稀疏性问题得到一定的了改善,推荐性能得到了一定的提升。
其他文献
随着深度学习的发展,图像生成技术有了长足的进展,研究人员提出了许多图像生成算法,但大多数图像生成算法只能生成单一图像,有些工作却需要图像对的数据集支撑。针对这一问题,本文重点研究生成图像对问题。图像对指的是主体高级特征相同,部分低级特征不同的对应图像元组,高效生成良好图像对可以更好地满足相关工作任务的需求。生成模型有多种,目前研究最多的是生成对抗网络和变分自编码器,本文主要研究变分自编码器的耦合模
软件定义网络(SDN)采用流量控制和转发分离的思想,具备网络可灵活配置的优势,迅速在数据中心网和企业WLAN网等小规模网络中得到了广泛应用。随着网络规模的增长,SDN网络中单一集中式控制器难以满足急速增加的流量需求,因此引入多控制器架构对网络流量进行管理和控制。但多控制器架构由于初期设计方式不合理以及实际运行中流量波动性较大等原因,容易出现负载不均衡的问题。针对此问题,本文从多控制器部署和交换机迁
电力电缆是电网正常运行的重要电力设备。在电缆及附件输电过程中,绝缘介质在直流电场长时间作用下,空间电荷积聚会造成绝缘介质产生局部放电场,进而引发局部放电。对电力电缆的局部放电进行实时监测可有效掌握电缆运行状态,是保证电网安全运行的基本要求。目前国内外研究人员针对电缆局部放电的检测提出了多种方法,但是针对长距离高压直流电缆局部放电检测研究还缺乏有效的实验手段。根据以上研究背景,基于萨格耐克(Sagn
目前,网络平台层出不穷,用户量和信息量都呈现爆炸式增长。网络平台门槛低、管理宽松,给垃圾用户的出现创造了有利的条件。平台中的垃圾信息,在给正常用户造成困扰的同时增加了网络负担,检测垃圾用户已成为网络空间安全领域关注的热点话题之一。因此针对目前垃圾用户检测的优缺点,提出基于符号网络的垃圾用户检测方法,主要工作如下:(1)首先对垃圾信息以及垃圾用户进行了分析,同时介绍了节点间距离度量的方法,并总结了文
随着信息检索技术的飞速发展,人们获取信息的方式也日益多样化,高效地获取更接近人们需求的信息成为信息检索的一个重要内容。与一般文本信息检索内容不同,数学表达式表达形式多样、语法语义变换丰富的特点给基于数学表达式的检索及其结果排序带来了困难和挑战。因此,如何利用数学表达式复杂结构和语法语义特性,实现基于数学表达式的科技文献检索,对于提高信息检索技术的有效性和适应性具有重要意义。通过对数学表达式特点的分
AD是威胁老年人健康的重大疾病。随着影像学的发展,不同模态的脑影像成为医生临床诊断的重要依据。单一模态反映人体脑组织的信息有限,其中功能成像PET从生理上反映神经突触的活性,但分辨率低;解剖成像MRI显示清晰的脑组织结构,但无法追溯到病理根本。将PET和MRI图像的优势互补生成融合图像,可提高AD诊断的特异性和准确性。目前常用的频域多尺度变换方法中,ShearLab 3D变换仍存在边缘细节模糊的问
随着光伏电厂运行年限的不断增加,光伏组件的故障及老化问题逐渐显现,这些问题在降低组件发电效率的同时还会引发安全问题。由此可见,定期对光伏电站进行运维,及时发现并处理故障、老化的组件,对保障光伏电站的正常运行十分重要。基于此,本文以实际运行中的光伏阵列航拍红外图像为实验对象,设计了相应的故障智能识别算法,从而实现光伏组件故障的自动分类与精准定位。具体内容如下:(1)设计了基于Otsu_Iterati
据调查,缺血性心脏病以及中风的死亡率居全球范围内疾病死亡率的第一名和第二名,是中老年人死亡的主要原因。随着我国经济的发展,我国心血管疾病患病人数持续增加,患病率和死亡率处于快速上升阶段。随着医学影像技术的发展,医生可以通过患者影像初步分析诊断心血管疾病情况。其中,CTA(Computed Tomography Angiography)成像技术因其成像设备的普及性、成像分辨率高、非侵入性、操作简单、
自动制造系统(Automated Manufacturing System,AMS)资源优化是指在满足预先设定的生产任务的前提下,使用最少的资源,以达到节约生产成本、提高经济效益的目的。由于AMS具有强离散型、事件驱动等特点,因此在逻辑层面常抽象为离散事件系统进行研究,Petri网具有数学和图形双重表示的特性以及丰富的系统分析手段,被广泛应用于离散事件系统的研究。本文基于标签Petri网以及带有不