【摘 要】
:
近年来,随着互联网的快速发展,信息的爆炸性增长使人们为做出合理的选择需要投入更多的时间和精力,用户如何能够快速高效地在海量数据中找到所需要的信息成为当今时代亟待解决的一大难题。个性化推荐能够通过分析用户的历史数据获取用户偏好从而进行信息的推送。因此,个性化推荐的广泛应用很大程度上缓解了信息过载带来的问题。传统的推荐算法仅对用户与项目之间的静态关系进行建模,忽略了用户在现实生活中兴趣会随着时间发生变
论文部分内容阅读
近年来,随着互联网的快速发展,信息的爆炸性增长使人们为做出合理的选择需要投入更多的时间和精力,用户如何能够快速高效地在海量数据中找到所需要的信息成为当今时代亟待解决的一大难题。个性化推荐能够通过分析用户的历史数据获取用户偏好从而进行信息的推送。因此,个性化推荐的广泛应用很大程度上缓解了信息过载带来的问题。传统的推荐算法仅对用户与项目之间的静态关系进行建模,忽略了用户在现实生活中兴趣会随着时间发生变化的实际情况,导致推荐结果的准确性不高。而现存的一些基于用户长短期兴趣的推荐方法通常将用户行为序列视为均匀分布,未能准确捕捉用户在短时间内的兴趣变化,造成推荐结果单一。因此,针对以上问题,本文提出了一种基于用户行为距离的序列推荐方法,该方法包括如下两个部分:(1)融合时间信息的用户行为序列处理方法。用户对项目的各种反馈行为背后存在动态的行为距离,传统的兴趣建模方法未能很好地考虑用户行为中的时序性与相关性。针对以上问题,本文提出了一种融合时间信息的用户行为序列处理方法。首先,通过分析用户行为序列,将用户行为距离划分为时间距离与意图距离;然后利用加入时间门结构的门控循环单元建模行为之间的时间间隔,捕捉用户意图的转变程度;最后通过多头自注意力机制的多个注意力头建模不同行为之间的意图距离,捕捉用户不同方向的关注点。在第二部分中主要利用该序列处理方法对用户的短期兴趣进行建模。(2)基于用户长短期兴趣的商品推荐模型。用户的兴趣并非一成不变,而是会随着时间的改变动态变化。通常来说,用户兴趣可以分为易变的短期兴趣和稳定的长期兴趣。为了准确提取用户的动态兴趣,满足用户的购物需求,本文提出了一种基于用户长短期兴趣的商品推荐模型。首先将用户的历史行为序列划分为不同的会话,每个会话内用户的行为之间具有一定的连贯性,将最新会话内的行为视为用户的短期行为,历史会话序列视为长期行为;然后分别建模用户的短期兴趣和长期兴趣。针对短期行为,利用融合时间信息的用户行为序列处理方法进行处理。针对长期行为,主要考虑用户兴趣刻画的全面性,本文采用一个基于深度加权的Deep FM模型,同时提取用户在会话内的多峰兴趣和项目级的长距离依赖;最后使用自适应门控单元融合长短期兴趣,并根据得到的用户最终的兴趣向量计算每个商品的得分,排序后进行推荐。为了验证本文所提推荐方法的有效性,在两个真实数据集上进行了对比实验。实验结果表明基于用户行为距离的推荐方法能够有效提高推荐结果的准确性,本文所提方法相较于GRU4Rec、SHAN、DIEN等主流方法在命中率HR和平均倒数排名MRR等指标上均有一定程度的提升。此外,本文提出的推荐方法在考虑时间因素的同时,还能够主动探索用户的新兴趣,更好地适应不同的购物场景下用户的即时购买需求。
其他文献
漏洞检测一直是软件安全领域的一个重要研究问题,近年来,基于深度学习的代码漏洞检测技术取得了长足的进展,相比于传统方法,它不依赖领域专家,能够自动提取漏洞模式。然而,已有研究表明,深度学习模型具有脆弱性,在样本上施加一个精心设计的小扰动,就有可能成功欺骗模型,使模型输出错误结果,如果稍加扰动就可以让漏洞程序逃避检测,这将对软件安全造成巨大的威胁,施加扰动的方法即是对抗攻击方法。目前,针对对抗攻击方法
在流行病学中,时空数据可以帮助追踪传染病的传播过程,由于这些数据在现实中涉及到如溯源等具有重要实际意义的应用,所以对数据的真实性有较高的要求,同时目前时空数据大多由各个企业、机构单独集中式存储,从而形成了一座座“数据孤岛”,极大的降低了时空数据的流通性和数据价值,并增加了数据造假的风险。区块链技术的不可篡改性与透明性可以为时空数据的存储、共享与溯源需求提供良好的支持,但是当前区块链的数据结构并不是
随着数据相关理论和技术的快速发展,金融、医疗、电力等各领域均产生了海量数据。这些数据来源分布广、格式多变、规模庞大。然而,由于网络传输、人工审核校验等原因,数据集当中某些属性存在缺失甚至错误,数据质量难以保证。良好的数据质量是支持分析、决策以及可视化等的重要基础。如何提高数据质量,成为当前数据处理领域研究的热点问题。本文对其中的数据填补问题展开了研究。在数据填补问题上,许多学者进行了研究,提出了一
无线传感器网络是指在特定区域内由若干个带有监测、传输数据功能的微型节点形成的自组织网络,可向用户传输监测信息。早期无线传感器网络路由协议着重于节能,但随着应用环境的改变,数据传输的可靠性变得十分重要。针对异常事件监测场景下,以保证数据可靠传输、均衡网络能耗为目标,提出一种基于分簇与信任的可靠传输路由协议。该协议主要包括基于节点多指标的信任评价模型和改进的基于梯度分簇模型,将二者应用在分阶段传输的路
软件测试作为保证功能交付,提前发现软件项目问题的主要手段日益受到学术界和产业界的重视,自动化软件测试是其中一个热门领域。自动化软件测试技术通过程序分析等方式,不断生成测试用例执行程序,目的主要是覆盖尽可能多的程序路径以及发现能够导致程序崩溃的漏洞。基于覆盖率引导的模糊测试与动态符号执行作为两大主流的自动化软件测试技术已被广泛研究并应用到学术界与工业界中,这两种技术有明显的特点:模糊测试通过对测试用
随着移动设备的普及和网络资费的提速降价,智能手机迅速走进每家每户,并扮演着极其重要的角色,其中安卓手机在市场中占据了相当一部分份额。智能手机普及以后,各式各样的手机应用也如雨后春笋般涌现出来,现如今,人们的衣、食、住、行,绝大多数事务都可以通过手机上的一个个应用程序解决。然而,这些手机应用在提供便利的同时,也极有可能造成用户隐私数据的泄露。例如一些攻击者可能会发布恶意软件窃取用户的隐私数据,如手机
随着信息技术和人工智能的迅速发展,智能化微震定位和成像技术被广泛应用于火山、煤矿、油田等众多地区。近年来,随着我国煤矿开采深度的增加和开采强度的提高,大能量矿震事件频发,造成大量人力物力的损失。因此,精准有效的微震定位和成像方法是煤矿监测领域研究的热点问题。微震定位和成像技术依赖于微震发生时,微震源发出能量波信号的监测数据。受地下介质速度结构异构性影响,能量波信号大多不沿直线传播。同时,受背景噪声
社会经济的发展极大地改善了人民的生活,人民群众对物质文化生活的美好愿景不断增强。同时,人类已步入大数据时代,如何从海量数据中挑选出用户感兴趣的信息并将其推荐给用户,已成为商家和用户共同关注的焦点。因此,个性化推荐系统应运而生。用户评论蕴含了丰富的情感信息,传统推荐方法对此考虑较少。一些研究虽引入文本处理方法,但也仅是对用户评论这种单一文本进行处理,并且无法根据用户偏好对评论进行细粒度的情感分类,这
随着技术的不断发展,科技在不断改变人们的生活方式,尤其是在医疗领域,人工智能技术的加入,提高了医生工作效率的同时,还可以时刻监测患者的健康信息,智慧医疗逐渐走进我们生活的方方面面。在这些技术的背后,离不开相关数据的支持,而文本数据是医学领域最常见的表现形式,对医疗文本的知识抽取以及数据的规范化是技术发展的基础,同时对推动医疗健康的发展具有重要意义。本课题主要研究面向医疗文本的嵌套实体抽取和实体标准
随着计算机图形学的飞速发展,由于具有更贴近真实的视觉效果,三维几何模型在各个领域获得了广泛的应用。因此,作为计算机图形学的新兴分支学科,数字几何处理也逐步进入人们的视野。而曲面参数化技术作为数字几何处理领域的热点与难点,也逐渐深入社会生产生活的各个方面。由于三角网格更能展现三维模型的细节,所以本文以三角网格数据作为基础,针对现有算法存在的非线性,算法复杂度较高等问题,分别对0亏格的封闭网格以及带孔