论文部分内容阅读
近年来,随着科技的进步,移动通信网络以及移动智能终端得到了快速发展,在高速网络的支撑下,短视频数据呈指数级别增长趋势,短视频行业成为了互联网主要的流量入口之一。丰富的短视频内容改变了用户的行为习惯,为用户提供了更加便捷的社交途径。短视频类型多样、内容丰富,由于其特殊的表现形式,使短视频网站很难为用户提供个性化推荐服务,因此融入推荐算法的短视频系统应运而生。个性化推荐算法能够根据用户的个人信息以及历史交互信息,挖掘出用户的喜好,为用户提供喜欢的内容。推荐算法的优劣直接影响到用户的体验,不同的推荐算法和特征处理方式,在不同的应用场景下的推荐效果不同,如何在大量短视频数据中提取有效的特征,获取最优的短视频推荐算法,为用户推荐感兴趣的内容,避免短视频网站的信息过载,成为亟待解决的问题。本文的主要工作包括以下几个方面:(l)进行抖音短视频数据的爬取,使用Fiddler进行数据抓包,解析数据接口,分析数据包中各个参数代表的含义,通过程序模拟客户端向目标服务器发送数据请求,解析服务器的响应内容,最终得到用户相关数据、短视频相关数据、交互相关数据。(2)针对短视频推荐过程中,单一算法准确率低的问题,提出基于多重粒度召回的短视频推荐算法,利用采集的短视频数据,提取用户特征和短视频特征,构建算法并进行模型训练。该算法首先使用粗粒度召回策略,利用协同过滤算法,为用户生成粗粒度召回集;然后使用细粒度召回策略,利用XGBoost算法,对短视频进行预测并排序,为用户生成细粒度召回集;最后使用精确推荐策略,对HOP-Rec算法进行改进,为用户产生推荐列表。该算法能够准确地为用户进行短视频推荐,并达到了显著的推荐效果。(3)设计并实现了短视频推荐系统,采用C/S架构,服务端使用SSM框架进行开发,客户端基于Android平台进行开发,并嵌入基于多重粒度的短视频推荐模型,为用户推荐个性化的短视频内容。