【摘 要】
:
推荐系统出身于互联网时代,用于解决大规模信息爆发问题,可以有效帮助人们在数字大海中寻找需要的信息或商品。目前,互联网公司大多都为他们的系统配备了推荐引擎来取得更好的收益,比如美国著名的电子商务网站亚马逊,其收入的百分之30得益于在线系统部署的推荐引擎。在国内,同样有一大批公司在其在线系统上使用着推荐技术。例如淘宝、京东、拼多多等人们经常使用的在线购物服务商;网易云、爱奇艺等娱乐服务供应商等,正是这
论文部分内容阅读
推荐系统出身于互联网时代,用于解决大规模信息爆发问题,可以有效帮助人们在数字大海中寻找需要的信息或商品。目前,互联网公司大多都为他们的系统配备了推荐引擎来取得更好的收益,比如美国著名的电子商务网站亚马逊,其收入的百分之30得益于在线系统部署的推荐引擎。在国内,同样有一大批公司在其在线系统上使用着推荐技术。例如淘宝、京东、拼多多等人们经常使用的在线购物服务商;网易云、爱奇艺等娱乐服务供应商等,正是这些在线服务的存在使得我们现在的生活方便快捷又多姿多彩。目前现有的推荐系统大多都是基于统计学知识以及机器学习方法构建,通过对用户的历史记录进行处理,来获得用户画像和物品画像,随后将这些特征输入各种推荐系统模型进行运算从而产生一个的结果。然而这些推荐方式仍属于静态推荐,因为他对于用户的反馈信息不能动态地加以应用,所以推荐的结果只能是针对单一时刻的效果而无法做到长效动态地进行推荐。为了实现长效动态的推荐效果,本文决定将强化学习与推荐系统进行结合。强化学习是一种用于实现序列交互过程收益最大化的学习方法,很适合解决目前推荐系统存在的问题。本文针对传统的推荐算法只能静态周期性更新而缺乏长效性这一问题,提出了一种基于强化学习的电影推荐系统,系统采用离线收集的用户交互日志中的数据来对推荐算法进行训练,通过对日志数据进行处理来获取可以用于强化学习推荐算法的训练数据,同时对在强化学习推荐算法训练过程中产生误差的来源进行分析,并提出了解决方法。主要工作内容和结论如下:(1)设计了一种基于强化学习的电影推荐系统,同时提出了一种日志数据的处理方法,用于生成强化学习推荐算法训练所需要的强化学习四元组数据。(2)针对经典的强化学习算法进行修改,分别实现了基于DQN的推荐算法、基于DDPG的推荐算法以及基于Reinforce的推荐算法。分析了以Movielens-100k数据集进行训练时,强化学习推荐算法出现误差的来源。(3)针对使用离线数据集训练强化学习推荐算法容易出现训练误差的问题,提出一种将模仿学习与强化学习相结合的推荐算法,通过在训练过程中将状态与动作进行约束来限制强化学习产生误差。(4)针对模仿学习与强化学习在同一个网络训练时,存在训练效果不稳定不可控的问题,本文提出一种解耦网络的改进训练方法,通过使用两个网络分别训练强化学习和模仿学习,并使用一个参数来调节模仿学习对于强化学习动作选择范围的限定程度,以此来控制训练效果的偏向。(5)通过在全新数据集上再次实验来测试本文提出的推荐系统的效果,最终验证了本文所提出的推荐系统以及改进训练方法的有效性。
其他文献
公交到站时间是乘客需要的重要信息,准确的到站时间预测可以减少出行者等待时间、缓解焦虑情绪、提升公交服务水平。站点客流预测是公交发班时刻表制定和公交线路规划的重要依据,准确的客流预测可以提高公交资源利用效率、缓解站点客流拥堵。本文构建基于深度神经网络的滚动预测模型,以广州实际公交、客流数据为例,探讨提升公交到站与站点客流预测准确性的方案,并依据需求分析在大数据平台上设计、实现公交预测系统,主要内容如
随着时代的飞速发展和技术的不断革新,医疗保健床不断地趋于自动化、智能化、人性化,但是结合传统中医艾灸和现代机械的艾灸床的发展却落后于时代的步伐,没有适用的监控系统。本文利用嵌入式技术,并根据艾灸床的机械结构和工作原理,设计开发了一种适用于医用艾灸床的监控系统,也是首次将监控系统运用到艾灸床当中。本文采用STM32F103ZET6作为整个监控系统的主控芯片,使用温度传感器检测艾灸床工作时的温度,使用
膝关节损伤在各个年龄段都十分常见,膝关节损伤患者如果在术后接受科学合理的康复训练,将有助于患者的术后康复。为辅助膝关节损伤患者的术后康复训练,市面上出现了一种可调式膝关节支具。患者在佩戴该支具后,支具可以将患者膝关节的弯曲角度控制在指定的范围内,让患者可以循序渐进的锻炼自己的膝关节。个性化康复支具是对现有膝关节支具的改进。与可调式膝关节支具相比,个性化康复支具依据患者的形态特征进行设计,可以完全与
随着电子工业的蓬勃发展,微纳加工制造成为众多半导体器件制造企业的重大需求。微纳精密电子制造产业是我国综合制造能力迈向新时代的关键一步。基于柔性机构的微动定位平台作为微纳加工制造装备中的核心部件之一,因其高分辨率、快速响应的特点被广泛应用于定位运动台、微操作器、原子力显微镜等诸多领域。由于压电陶瓷的位移受其长度的限制,为了延长压电陶瓷的行程范围,人们开发了各种放大机构。利用放大机构,虽使压电陶瓷所采
无人驾驶技术作为当今前沿科技的重点研究对象,对经济增长、道路安全、国防建设等有巨大的推动作用。环境感知技术作为无人驾驶关键技术之一,决定了无人驾驶车辆能否获知全面的道路信息并规划出安全合理的行驶路线,因此具有重要的研究意义。本文依托中国大学生无人驾驶方程式大赛(Formula Student Autonomous China,FSAC)对FSAC赛车环境感知技术进行研究,拟解决当前FSAC赛车因环
光接收器是光纤传输系统的重要组成部分,接收器的性能决定了传输质量。因此,本文将基于低噪声、低干扰角度,对拉曼光纤放大器(Raman Fiber Amplifier,简称RFA)和光时域反射仪(Optical Time Domain Reflectometer,简称OTDR)两者的光信号接收模块的电路进行研究。RFA利用泵浦光源对在光纤中传输的光信号进行放大,多路泵浦激光器能够同时对光纤内传输的多波
液晶透镜自1979年被提出以来就备受国内外众多相关科研工作者的重视。基于液晶材料的光电特性,使液晶材料应用于透镜时可以在不改变自身形状的情况下,依靠控制空间电场分布来改变液晶的折射率,其光学性能的调节得以实现。相较于传统变焦透镜,液晶透镜具有体积小、变焦灵活、无机械磨损等优势,在光学影像、光电系统、生物医学等众多领域上具有巨大应用潜力。空间电场分布的控制是液晶透镜调节光学性能的关键,本文针对液晶透
随着深度学习和计算设备的不断发展,复杂模型能够实时运行在并行计算设备中,使得人工智能技术从理论研究走向了实际应用。场景理解是计算机视觉技术中主要领域之一,其通过捕获数据间的上下文关系,实现对客观世界的认知。随着汽车智能化的不断推进,自动驾驶汽车成为研究热点之一。在自动驾驶技术中,道路场景理解能够分解道路交通中的要素,是使汽车能够路径规划与决策的先决条件之一。针对于不同的交通要素,结构化的分解适应不
贴面板材是定制家居行业最常用的成品板材,约占70%以上。在贴面板材的生产过程中,板材封边的质量直接影响了成品板材的品质优劣。现今,板材封边后的质量检测任务绝大部分依靠质检员目测完成。但该方法检测速度慢、精度低并且结果不稳定。本文致力于研究出一套基于机器视觉的板材封边缺陷检测系统,以达到较高的缺陷检测精度、并且能稳定地输出检测结果。本文首先分析了机器视觉系统的各组成要件和缺陷检测中的主流算法,研究不
在对海洋进行水下声学探测时,水面与海底之间的区域构成其测量范围,其中,海底沉积物作为下边界,其声学特性是海洋声学探测的重要研究内容之一,与海洋科学的发展以及海洋开发和建设息息相关。目前对于海底沉积物声学特性的研究主要基于实验室声学测量,但由于脱离了原位环境,其测量结果与原位测量相比存在偏差,这种偏差的变化机制和程度一直是悬而未决的问题。因此,有必要研制一种海底沉积物压力环境模拟声学测试系统,用以研