个人直播用户行为分析及预测

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:pppxulan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
移动终端的普及和网络性能的提升使视频的实时交互式传播成为可能,作为其中的典型代表,近年来出现的个人直播平台已达数十家,用户在此类平台上不仅可以作为看播端观看视频,也可以作为主播端实时产生上传自己的个人直播视频流。  用户行为泛指用户在个人直播平台上的各种活动,这方面的研究对个人直播平台来说具有重要的意义,然而已有研究工作中几乎没有针对个人直播平台用户行为的研究,也未考虑到时间、地点、网络等多种因素对用户行为的影响。  针对现有相关研究工作的不足之处,本文采集了中国某家个人直播平台的真实数据集,对个人直播模式下的用户行为展开研究,主要成果包含以下几点:  1、用户行为数据测量分析。依据现有数据提供的信息对多种用户行为深入挖掘,在用户全平台宏观活跃度、主播推流行为、看播拉流行为、社交属性行为、体验质量指标及其对用户观看行为的影响等几个方面展开深入测量分析,发现了用户活动具有周期性、主播用户与看播用户的流量贡献程度服从幂律分布、社交关系高度集中、个人直播对体验质量敏感、卡顿率对观看时间影响程度最大等重要结论。  2、基于回归模型的用户观看时间预测。以用户日观看行为变化的周期性为理论依据,考虑到不同用户群体之间行为的强差异性,提出了基于决策树的Adaboost集成回归模型(Ada-DT),根据前8天的数据及其他重要特征通过回归计算预测用户第9天的日累计观看时长。该模型能避免多元线性回归训练速度过慢、CART回归部分样本欠拟合现象及GBDT回归训练集过拟合等问题。仿真实验表明,Ada-DT模型的平均预测误差率比LR、CART、GBDT等算法低20%,标准均方误差在整个测试集上较对比算法降低了30%。  3、基于知识图谱的用户观看主播预测。针对当前数据字段中缺少用户类别标签、互动记录及关注列表等信息,导致用户兴趣获取困难的现状,本文提出了基于知识图谱的观看主播预测算法(APKG),该算法利用前8天的数据集建立用户观看关系知识图谱,刻画用户的自身属性,挖掘用户间的兴趣联系强度,捕捉用户关系的传递效应,用以预测用户第9天的观看主播列表,同时引入指数衰减函数,提出了基于时序的图谱兴趣关系边权重更新策略。仿真实验表明APKG性能优于基于用户历史行为的算法,其中准确率和召回率均提升了约10%,TOP-N准确率提升了约20%。
其他文献
光电测控系统一般由伺服控制分系统、图像处理分系统、数据通信分系统、时统分系统组成,目前各分系统是由PC104工控器或DSP处理器实现,分系统各自独立,相互之间通过串行总线进行
学位
随着计算机和通讯技术的快速发展,在市场竞争日益激烈的环境下,企业更加重视整体工作效率的提高和成本的降低。在实际的工作应用过程中,企业很多业务流程都涉及到工作流处理,比如
Web服务业务流程执行语言(Business Process Execution Language for Web Services,BPEL4WS)可以将多个Web服务(Web Services)组合起来,形成Web服务工作流,提供更为灵活的方式集
个人网格是个人网络计算的系统平台。其最显著的特性是松散耦合一用户、平台与资源之间都是松散耦合的。松散耦合性一方面降低了用户的使用成本、提升系统价值;另一方面造成个
随着3G网络的演进和业务的发展,3G网络的安全越来越受到业界的重视。然而,GTP (GPRS Tunnel Protocol, GPRS隧道协议)协议作为3G核心网中的重要承载协议,在设计之初并没有考
软件开发过程的不可见是软件项目失败的主要原因之一。为了提高软件开发过程的可见性,研究人员从软件开发过程的表示、软件开发知识的管理和软件开发数据的挖掘等方面提出了相
观察点设置问题是地形可视性分析中的一类重要问题,对该问题的研究可以在空间信息辅助决策、通信、旅游、野生动物保护等领域发挥重大作用。本文在对地形可视性分析中观察点设
随着Internet技术的普及和发展,图像图形技术作为Web浏览技术的基础,发挥着至关重要的作用。然而,从目前的Internet及浏览器的核心技术来看,对于图形图像的支持还仅仅局限于对图
无线传感器网络是近年来信息技术领域的一个研究热点,它集成了无线通信、感知、嵌入式计算、网格计算等技术,是一种典型的无基础设施通信网络。无线传感器网络这门新兴的技术可
多媒体的不断普及,它已经成为了我们获取信息的一个重要手段。与此同时,视频安全播出的形势也愈发严峻。数字视频的播出环节比模拟视频复杂得多,播出中常产生的多种异态,而节