【摘 要】
:
传统电视行业在计算机技术的发展下已完成智能化升级,智能电视使得用户可以方便快捷地享受视频服务;与此同时互联网规模的不断扩大使得数据量与日俱增。如何从繁多的视频资源中快速且准确地发掘出用户感兴趣的视频,是当前智能电视的视频服务提供方所面临的一大问题。作为解决“信息过载”问题的一种手段,推荐系统通过分析用户的行为,在物料库中做筛选,可以帮助用户发现自己的潜在兴趣。准确、及时的视频推荐系统可提升用户满意
论文部分内容阅读
传统电视行业在计算机技术的发展下已完成智能化升级,智能电视使得用户可以方便快捷地享受视频服务;与此同时互联网规模的不断扩大使得数据量与日俱增。如何从繁多的视频资源中快速且准确地发掘出用户感兴趣的视频,是当前智能电视的视频服务提供方所面临的一大问题。作为解决“信息过载”问题的一种手段,推荐系统通过分析用户的行为,在物料库中做筛选,可以帮助用户发现自己的潜在兴趣。准确、及时的视频推荐系统可提升用户满意度,增强用户使用粘性,并最终提高智能电视厂商的市场效益。目前基于离线批处理平台的推荐系统,虽然可以通过分布式计算在全量数据下得到较为准确的推荐结果,但推荐算法模型更新的时间太长、实时性差导致难以及时把握用户兴趣转换;另外基于深度学习的推荐算法相较于传统的机器学习推荐算法虽然表现更好,但运行模型服务时所需的计算资源也更多,云计算架构下的推荐系统越来越难以承受众多用户频繁的推荐请求。为解决以上问题,本文设计并实现了智能电视场景下的视频实时个性化推荐系统,以混合流水线的形式,将推荐流程分为召回、粗排和精排三个阶段,在云端流计算集群实现推荐的召回(Matching)和粗排(Pre-ranking)阶段,并创新性地将精排(Ranking)阶段在智能电视设备端实现。本文所设计的系统依据功能实现主要分为推荐模块、存储模块、数据收集模块和展示模块:(1)针对推荐模块,本系统在云端搭建了基于Flink流处理的分布式大数据计算平台,并通过此平台实现了召回阶段和粗排阶段。其中,召回阶段基于ALS算法求解矩阵分解实现;粗排阶段采用FTRL在线学习的方式实时更新逻辑回归模型,并使用批流结合的训练方式改善系统的冷启动问题,以此加快模型上线时间。在精排阶段,基于嵌入式AI技术,融合行为历史序列与用户属性,设计并实现基于用户行为序列的深度神经网络模型SBDNN(Sequential-Based Deep Neural Network)。并将其部署在智能电视端侧,通过模型本地推断的方式做实时推荐,减轻云端计算压力。此外,设计端上精排模型的局部更新策略,减轻云端下发模型更新包时的网络资源消耗。(2)针对存储模块,使用基于文档的关系数据库MongoDB和基于内存的键值数据库Redis分别提供持久化存储和缓存。其中MongoDB持久化存储用于训练的全量数据,Redis缓存召回阶段和粗排阶段的推荐结果。(3)数据收集模块方面,通过Flume日志采集工具和Kafka消息缓冲队列获取用户行为,用于云端的推荐业务响应和推荐算法训练。(4)展示模块方面,系统在云端搭建了用于流计算集群状态监控和推荐算法评估指标统计展示的Web服务,并在智能电视设备端实现了用于精排阶段业务展示的可视化程序。本文对传统的智能电视视频推荐系统做了架构上的优化与升级,划分功能模块并搭建了完整的推荐平台。通过实验验证,所设计实现的智能电视视频实时推荐系统在保证预测准确度的情况下,具有较强的实时性,系统整体有较高的应用价值。
其他文献
本文以3-甲基环十五烯酮为原料,在催化剂、加压、升温、搅拌等条件下,通入高纯氢气反应合成麝香酮。利用气相色谱仪、气质联用仪、红外光谱分析仪和核磁共振波谱仪等仪器进行检测,表征合成样品。采用单因素方法考查了3-甲基环十五烯酮催化加氢反应中催化剂种类、反应温度、反应压力、搅拌速度等对产率的影响。结果表明,以钯碳作为催化剂,反应压力2.0 MPa,反应温度90℃,搅拌速度为1100 rpm,反应时间为1
阅读能力是一项必需且重要的能力,在人的发展中处于基础和核心的地位,尤其对于小学生来说,阅读能够促进其智力、道德和审美水平的全面发展。面对错综复杂的图书海洋,如何推荐与学生所处学段阅读能力相匹配的课外图书成为摆在广大教师和家长面前的难题。分级阅读能够为破解这一难题提供思路,分级阅读的目的就是将读者所处学段的阅读能力和文本难度相适应,针对英语的分级阅读测评体系如Lexile阅读框架和A-Z分级法等经过
我们常说的乡土文化主题研学是新时期教育与教学环境下的一种历史延续体验,是构建学校特色课堂的重要途径,论文以寻乌县本土文化为媒介,以我校开展的特色地理研学为例,开展了一系列的研究与探索,由此提出了要构建富含江西省地域特色的高中地理研学实践体系,希望能够在这样的活动中巩固学生对地理知识的掌握,并逐步提升学生的地理学科核心素养、国家情怀以及自我认识。
“高考难,填报更难”一直是每一个高考家庭面临的重大问题。繁多的院校和专业信息、每年高考政策的改革以及各院校招生计划的变动让高考志愿的填报困难重重。如何从如此繁杂且庞大的信息中提取出符合考生个人情况的相关信息是亟待解决的问题。随着互联网技术的日新月异,推荐技术也得到了巨大的发展。本文针对高考志愿填报中难以选择合适院校和专业的问题,设计并实现了基于混合推荐的高考志愿推荐系统。本文主要研究工作如下:(1
情感分析是自然语言处理领域的一个分支,近年来引起了广泛的研究与关注。但是对于某些特定语料,通用的情感分析模型往往达不到最佳的分类效果。对于短文本情感分析任务,短文本的语言表达简短、语义稀疏、携带的特征少,现有的网络模型从短文本中学习到的语义特征不足。对于句子级的情感分析研究,Bi-LSTM无法获取不同词对情感的贡献,也无法从多方面获取语义,并且训练时神经元无法并行计算,同时对于较长的句子容易丢失语
对于城市轨道交通企业而言,去正外部性是集团化的内因和目的,结合内部审计新趋势,通过对集团化过程中出现的典型审计问题的分析与优化,提出动态化和全过程审计链的内部审计优化研究新思路,在实践应用中取得了良好效果。
目的 利用真实世界数据,从药物有效性、安全性和经济性角度出发,利用社会网络分析研究医师用药习惯,为按疾病诊断相关分组(DRG)付费下合理用药提供思路。方法 选取2021年1月1日—6月30日某三级甲等综合医院出院患者信息,基于DN-DRG分组器,获取甲状腺大手术组(KD19)所有合并用药,绘制整体网络关系图,根据凝聚子群网络的树形图开展用药方案优化。结果 共纳入80种常用药物,通过对1 681例甲
图书馆是每个高校的核心教辅机关,是师生学习提升学习能力的重要场所。面对数以百万计的图书时,师生往往难以找到合适的、真正需要的书。检索主页热门TOP-N推荐书籍对于个人需求过于笼统,不能起到针对性效果。为此,个性化的推荐系统是高校图书馆发展的新方向。传统的推荐系统主要基于学生借阅记录的情况进行的协同过滤推荐,或者挖掘书籍间相关性TOP-N推荐,可以面向大众。但对于特定的群体——相同专业不同学习层级、
互联网技术的迅猛发展,使得互联网用户生产和面临的数据不断增加,从而使得人们面临“信息海洋”的困境。因此推荐系统应运而生,成为帮助用户在海量信息中过滤有效信息的首选方式。在推荐系统的实际应用中,由于原始数据高维稀疏,用户或物品相似度计算片面以及推荐结果实时性差等问题,使得用户的体验并不良好。本文为了更好地优化推荐系统,以大数据处理技术为基础对推荐系统的系统架构和推荐算法两方面进行改善。在推荐系统架构
真实-虚拟-构造仿真(live-virtual-constructive,LVC)实验中存在大量异构的仿真资源对象。针对传统对象模型已无法满足信息化战争对武器装备体系快速响应的实验任务需求问题,开展基于对象元模型的LVC实验资源服务化方法研究。给出基于对象元模型的资源描述方法,在对象交互、消息传递、远程方法调用3类资源服务化基本形式基础上,设计虚拟化状态对象(virtualization infr