【摘 要】
:
当今世界,丰富多元的信息充斥着每个人的生活,信息过载问题尤为严重。对广大用户来说,信息过载带来的一个主要问题是:巨量冗余的信息将极大干扰用户对其所需信息的准确选择。如何从海量的数据中快速找寻用户最感兴趣的内容是当前各大平台关注的热点,这一现象促进了推荐技术的快速发展。在推荐系统中,如何根据已有的用户行为和信息准确地对用户偏好进行预测是最核心的问题。针对上述问题,本文围绕推荐领域的发展历程和研究现状
论文部分内容阅读
当今世界,丰富多元的信息充斥着每个人的生活,信息过载问题尤为严重。对广大用户来说,信息过载带来的一个主要问题是:巨量冗余的信息将极大干扰用户对其所需信息的准确选择。如何从海量的数据中快速找寻用户最感兴趣的内容是当前各大平台关注的热点,这一现象促进了推荐技术的快速发展。在推荐系统中,如何根据已有的用户行为和信息准确地对用户偏好进行预测是最核心的问题。针对上述问题,本文围绕推荐领域的发展历程和研究现状进行了充分的调研,整理分析了目前工作的不足与改进之处,重点研究了基于序列模型和基于图神经网络的推荐模型,并在前人工作的基础上进行了模型的优化,最终将推荐方法应用于原型系统。以下是本文的主要工作内容:(1)大多数端到端的模型忽略了上下文信息和用户行为数据之间的关联和融合,针对上述问题,本文研究了一种两阶段的序列推荐框架。此方法通过组合非入侵多头注意力机制和掩码语言模型融合上下文信息,使得用户序列获得了丰富的语义信息和特征表示。针对用户长期和短期兴趣有显著变化的问题,通过特定方式分别捕获用户长期稳定的偏好和用户即时意图。最终,采用自适应融合模块动态地为长短期偏好分配不同的权重,从而得到更符合用户个性化特征的总体偏好表示。该模型在Movie Lens和Amazon Beauty/Books数据集上取得了较好的性能。(2)针对真实场景中用户行为存在多种类型的问题,本文研究了一种基于图神经网络的多行为推荐模型。此模型采用自定义的元学习范式编码不同类型行为的特征表示,利用学习到的元知识生成转换权重,将特定类型的行为语义注入到初始嵌入中。同时采用基于注意力网络的多行为关系学习函数,解决不同类型的行为相互交织问题。最后通过图神经网络捕捉图结构中的高阶行为信息。三个电子商务数据集上的实验结果表明将不同行为之间的差异编码到用户的序列表示中能够学习到更准确的用户偏好特征,从而提高对目标行为的推荐效果。(3)设计并构建了用于购物推荐的原型系统,该系统采用阿里开源的淘宝用户行为数据集。遵循推荐系统的一般设计方案,先采用传统的基于协同过滤和内容相似的召回算法缩小对商品的计算范围,进而采用本文提出的推荐模型对召回结果列表计算预测值并进行排序,最后根据推荐列表渲染可视化界面呈现给用户。针对该系统中设计的各项功能如用户登录、订单管理、为你推荐等进行了测试和验证,结果证明了该原型系统可以稳定的运行。
其他文献
随着国民经济的增长,我国的汽车保有量也在快速增长,道路上车辆随之增多,交通事故的发生也更加频繁。交通事故发生的主要原因之一是驾驶员的危险驾驶行为,如超速、急转弯、疲劳驾驶等,如果对危险驾驶行为进行及时的检测和警告,就可以减少交通事故的发生。为此,本文开展基于车联网的驾驶行为评价系统研究,研究内容包括车辆数据采集、无线数据传输、云服务器数据处理、驾驶行为评价和移动端应用程序数据显示。系统根据制定的评
中国作为世界第一水产养殖大国,水产品产量稳居世界首位。中国传统水产养殖主要以个人化为主,水产养殖即养水,养殖人员大多根据以往的养殖经验进行水质状况的判定,且无法对水质状况进行提前预知,还容易因为个人操作致使水质恶化。随着物联网技术的发展,智能化水产养殖已逐步成为可能,本文将基于物联网技术设计一种可协助养殖人员对水产养殖水质实现智能化管理的水产养殖水质综合应用小程序,可实时观察水质状况并对未来一段时
随着计算机技术以及网络技术的不断发展,互联网用户普遍面临信息过载问题。推荐系统能够作为一种有效解决信息过载的工具,其能够从用户的行为数据中挖掘出用户的兴趣。然而在实际应用中,选择匿名登陆的用户或者新用户的历史档案等信息是不可知的。如何利用有限的行为数据以及交互项目种类之间的高阶联系来缓解数据稀疏的问题是目前推荐算法的一个难点。而对于非匿名用户来说,虽然拥有大量历史数据帮助推荐,但是其存在数据噪声过
随着第五代无线通信系统(The Fifth Generation Communication System,5G)时代的到来,汽车保有量不断地增加,海量无线业务数据朝多样化、智能化方向发展。此外,高频段毫米波因其具有波束窄、宽带宽、低延迟、穿透性高等特点被认为是未来车联通信系统的关键技术。基于概率整形(Probabilistic Shaping,PS)与正交频分复用(Orthogonal Freq
电力系统的稳定运行对维护社会稳定发展具有重要意义,变电站作为电力系统的枢纽,相关绝缘子设备由于受到机械应力以及室外恶劣环境的影响,绝缘子容易产生破裂破损,威胁电力系统安全稳定。因此,对变电站绝缘子设备定期巡检对维护电网安全具有重要意义。本文以变电站绝缘子缺陷检测系统设计为研究内容,对现有的Yolov5s与Faster R-CNN算法进行精度以及适用性上的改进,以及移动端绝缘子缺陷检测设备的实现。本
随着网络上中文短文本的爆炸式增长,以及由中文短文本组成的网络语料库也逐渐增多,中文短文本在各种网络应用中都发挥着重要作用。命名实体识别和实体链接是自然语言处理中的关键任务,也是处理中文短文本的重要技术,能够将非结构化的中文短文本数据转换为结构化的可利用数据,同时影响着自然语言处理中许多下游任务的准确性。然而,由于中文短文本表达不规范,以及语义极其稀疏等特点,对中文短文本进行命名实体识别和实体链接仍
近年来,机器人技术在城市灾害救援、城市无接触式配送等领域发展迅速,尤其是在国际战事和新冠病毒灾害发生后在军事和商业应用方面得到了前所未有的重视。路径规划技术作为自主导航的核心技术之一,已成为机器人技术的热点。随着机器人应用技术的不断深入,对提高机器人在复杂环境中的自主导航能力的需求越来越重要。由于灾害对环境造成的巨大破坏和救援环境的动态不确定性,基于建筑平面图、激光雷达点云图像、平面逃生图等灾前地
科技的飞速进步,使得互联网文本信息呈现指数化增长的趋势。从浩如烟海的文本信息中准确抽取实体和关系,对于构建知识图谱、实现智能对话等前沿技术有着重要的意义和价值。实体识别和关系抽取任务过去常采用的是流水线方法,不考虑两个子任务的关联性,而将它们独立看待。即先从文本中抽取出可能的实体并进行类别预测,然后对得到的结果集中的实体两两进行关系的分类。流水线方法存在诸多问题,例如级联误差、子任务相关性不足、信
苹果在采摘、运输和分选的过程中,其表面容易擦伤、磕伤,从而导致苹果品质受到破坏,而这些缺陷会导致出售过程中由于苹果品质不过关而出现大批量退货情况,这给果农的经济收入带来了很大的影响。目前我国苹果种植以中小型个体户为主,主要依靠人工进行缺陷检测和判断,因此为了减少苹果出售过程中出现大批量退货情况,提升我国苹果的品质和市场竞争力,需要一种无损和低成本的检测方式来对采摘后的苹果进行在线缺陷检测和识别。苹
杨梅是一种具有高附加值的水果,随着杨梅市场的扩大以及杨梅精品化发展,杨梅采摘的智能化需求日益增加。近些年深度学习的发展在农业智能化领域取得了瞩目的成就,许多学者将深度学习应用于水果分类分级上。但是在复杂光照、枝叶遮挡、果实堆叠的自然环境下,仍然存在漏检、误检和定位不准等问题。为提高杨梅采摘智能化水平,开发杨梅无损检测设备,本文提出了一种基于改进YOLOX-NANO算法的杨梅成熟度检测方法,并开发了