论文部分内容阅读
移动终端的普及和网络性能的提升使视频的实时交互式传播成为可能,作为其中的典型代表,近年来出现的个人直播平台已达数十家,用户在此类平台上不仅可以作为看播端观看视频,也可以作为主播端实时产生上传自己的个人直播视频流。 用户行为泛指用户在个人直播平台上的各种活动,这方面的研究对个人直播平台来说具有重要的意义,然而已有研究工作中几乎没有针对个人直播平台用户行为的研究,也未考虑到时间、地点、网络等多种因素对用户行为的影响。 针对现有相关研究工作的不足之处,本文采集了中国某家个人直播平台的真实数据集,对个人直播模式下的用户行为展开研究,主要成果包含以下几点: 1、用户行为数据测量分析。依据现有数据提供的信息对多种用户行为深入挖掘,在用户全平台宏观活跃度、主播推流行为、看播拉流行为、社交属性行为、体验质量指标及其对用户观看行为的影响等几个方面展开深入测量分析,发现了用户活动具有周期性、主播用户与看播用户的流量贡献程度服从幂律分布、社交关系高度集中、个人直播对体验质量敏感、卡顿率对观看时间影响程度最大等重要结论。 2、基于回归模型的用户观看时间预测。以用户日观看行为变化的周期性为理论依据,考虑到不同用户群体之间行为的强差异性,提出了基于决策树的Adaboost集成回归模型(Ada-DT),根据前8天的数据及其他重要特征通过回归计算预测用户第9天的日累计观看时长。该模型能避免多元线性回归训练速度过慢、CART回归部分样本欠拟合现象及GBDT回归训练集过拟合等问题。仿真实验表明,Ada-DT模型的平均预测误差率比LR、CART、GBDT等算法低20%,标准均方误差在整个测试集上较对比算法降低了30%。 3、基于知识图谱的用户观看主播预测。针对当前数据字段中缺少用户类别标签、互动记录及关注列表等信息,导致用户兴趣获取困难的现状,本文提出了基于知识图谱的观看主播预测算法(APKG),该算法利用前8天的数据集建立用户观看关系知识图谱,刻画用户的自身属性,挖掘用户间的兴趣联系强度,捕捉用户关系的传递效应,用以预测用户第9天的观看主播列表,同时引入指数衰减函数,提出了基于时序的图谱兴趣关系边权重更新策略。仿真实验表明APKG性能优于基于用户历史行为的算法,其中准确率和召回率均提升了约10%,TOP-N准确率提升了约20%。