基于变分自编码器的推荐算法研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:wangxingyu2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网信息爆炸式增长,如何对信息进行挖掘分析,已经成为了热点和难点问题。推荐系统的出现有效的缓解了信息冗余的问题。推荐系统的核心研究问题是通过用户的历史行为信息挖掘用户的主体偏好模式,从而根据不同场景和任务的需求完成推荐。传统的推荐方法中,隐因子模型可以有效地根据用户行为历史挖掘用户和物品的隐表示,深度模型扩展了传统模型的线性操作,提升了模型的表达能力。然而现如今推荐系统领域的研究仍存在一些问题。由于海量数据的存在,导致对于某个用户,其交互物品通常只占海量商品中极其稀少的一部分。并且由于交互信息内容的有限,很难获取用户偏好商品之间的优先级关系。此外,用户的偏好还会随着时间的变化而发展,一般的推荐系统很难捕获用户兴趣的变化方向。近年来,变分自编码器(Variational Autoencoder,VAE)在推荐系统领域有着广泛的应用。而变分自编码器作为一种非线性概率模型,其具有可以打破线性模型有限的建模能力限制的优势,并结合了生成模型的分布定义灵活性与深度学习非线性特征学习的能力。本文基于变分自编码器模型,针对目前推荐系统中存在的数据稀疏性、推荐准确性和推荐随时间变化的问题,提出了基于变分自编码器的排序模型和时序模型。本文的主要贡献如下:(1)针对一些深度生成推荐方法无法实现对隐式反馈的用户偏好数据建模从而生成个性化的列表级排序推荐列表的问题,通过借助多项式似然对变分自编码器采用列表级排序策略进行推荐。该模型能够生成点级隐式反馈数据,并为用户创建列表级的排序推荐列表。为了将排序损失与变分自编码器损失无缝结合,分别采用了平均倒排名(Mean Reciprocal Rank,MRR)和归一化累计损失增益(Normalized Cumulative Loss Gain,NDCG)作为排序损失,并使用平滑函数分别对其近似。模型在3个真实数据集上进行了一系列实验,证明了利用MRR和NDCG作为排序损失会使尽可能多的与用户相关物品出现在预测推荐列表的顶部。实验结果表明,所提出的深度生成排序推荐方法在排序估计任务中优于现有的几种最新方法。(2)针对一些深度生成推荐方法没有利用到隐式反馈用户偏好数据中的时序信息来进行个性化推荐的问题,结合了多项式似然的变分自编码器和时序特征生成模块完成推荐任务。该模型利用用户历史偏好记录中存在的丰富信息来扩展变分自编码器。模型给出了依据时序关系生成观测数据的建模方案,同时又引入了时序特征生成模块,该模块用以捕获用户与目标物品相关的兴趣演化模式。此外还给出了模型的扩展形式,将模型预测从用户的下一个时间步的行为扩展至接下来k个时间步的行为。模型在2个真实数据集上的一系列实验证明处理时间信息对提升变分自编码器模型的推荐准确性至关重要。实验结果表明,所提出的深度生成时序推荐方法在时序推荐任务中均优于已有的方法。
其他文献
地下排水管道长时间使用后,淤泥会在管道内沉积,需要对其及时清理来保证管道的通畅。在进行干线排水管道的清淤作业时,由于受到检查井口尺寸的限制,大型清淤设备无法进入排水管道,而小型清淤设备进入后会浸没在淤泥中无法行走。干线排水管道通常采用人工清淤的方式,不仅清淤效率低,而且管道内存在的易燃易爆有毒气体会对工作人员的生命安全造成威胁。针对干线管道清淤存在的问题,本论文研制了一种气压驱动的管道清淤机器人,
科研是学术的基础,是不断创新的驱动力。随着网络信息的发展,学术数据规模呈爆炸式增长,各类型学术知识平台成为学者科研活动中不可获缺的辅助工具。知识平台在学者科研过程中提供了大量的多类型知识,如文献、理论知识、会议信息、期刊信息等。本文通过研究发现目前知识平台辅助学者科研活动,存在三类问题。首先,在知识多源且信息爆炸的形势下,学者存在搜寻知识难的问题;其次是面对海量学术知识,学者存在用知识难的问题;最
近年来,随着中欧铁路集装箱运输需求的快速增长和市场化改革的推进,中欧公共班列通过采用舱位资源集中采购零散销售的模式,更好地满足了市场需求。而如何通过采用合理的舱位控制方法以提高自身收益,优化服务水平,成为了其经营管理中亟待解决的问题。为此,本文将收益管理理论引入中欧铁路集装箱运输的舱位控制问题中,提出了零散销售模式下多级定价-超订分配的舱位控制策略和方法,为班列经营企业的管理决策提供参考。围绕研究
本文面向无人车跟随控制问题,提出了移动闭塞-领航跟随模型,用以提升无人车跟随行驶安全性和车辆通行效率。基于建立的无人车跟随非线性系统模型,选择了结构简单、鲁棒性强、可靠性高的滑模控制算法,并采用准滑动模态削弱控制器输出抖振。考虑到实际行车环境中,噪声和扰动会带来系统授权点时变信息参数的不确定性,采用自适应控制处理系统时变参数不确定问题,设计自适应滑模控制律。本文的研究内容概括如下:首先,本文应用城
学位
社会经济发展加速了城市社区人口密度的增加,不断增长的居民楼数量和高度,以及越来越复杂的建筑结构和功能,使得突发事件在城市社区中易产生连锁反应、具有明显复杂性特征和潜在衍生危害,其中火灾突发事件在城市社区发生较频繁和产生危害较大。研究城市社区火灾突发事件情景分析与风险防范,能够充分掌握城市社区火灾突发事件发展规律,实现城市社区火灾突发事件事前防范,事发快速应对,有利于降低火灾发生概率以及减少火灾引发
日常消费品产品种类多,所处的生命周期各不相同,市场需求量大,且作为消费者生活刚需,一旦发生缺货,消费者便会选择其他品牌作为替代,零售企业同时面临着降低成本和提升服务水平的压力。合理的库存控制系统是避免库存积压或者产品短缺的关键,而其中最重要的决策就是订货策略。良好的订货策略是创造企业竞争优势、提高利润水平的重要手段,也是生存和发展的保证。首先,本文以日用消费品U公司的业务模式为背景,参考前人的结论
人工智能、物联网、云计算等先进的信息技术促进了传统物流业向现代物流业的转型升级,尤其是智能机器人的发展,极大地提高了物流各环节的效率,有效降低了物流总成本。近年来,一种新的“货到人”拣货作业模式已经开始在配送中心内部被采用。该模式利用AGV(Automatic Guided Vehicle)将货架搬运至拣货台,由拣选人员将商品拣选出来,货架访问若干拣货台后返回原位置,然后AGV再去搬运下一个货架,
我国港口建设在过去20年间快速发展,形成了布局完善、功能完备的五大沿海港口群网络。但由于近年来国际贸易的下滑,港口吞吐量开始放缓甚至负增长,区域内港口间为了维持市场份额,利用各种手段对腹地货源展开激烈争夺,极易产生恶性竞争问题,对港航业可持续发展构成威胁。因此,研究港口间合理的腹地竞争策略,对于提升港口决策水平、引导港航市场健康发展具有重要意义。本文首先回顾港口竞争、定价与运输网络规划相关国内外研
高速铁路的高质量发展离不开通信系统的支持,第五代移动通信(5th Generation Mobile Communication System,5G)技术的研究和快速发展将会成为铁路专用移动通信系统演进的重要牵引。为强化铁路安全防护能力、打造现代智慧铁路系统,铁路5G专用移动通信系统(5G for Railway,5G-R)不仅需要承载列车行车安全相关的业务,而且需要承载铁路沿线高清视频监控数据和