论文部分内容阅读
互联网和多媒体新闻行业迅猛发展,移动端的短视频平台逐渐进入大众化时代,短视频平台逐渐成为大势发展的风口。由于时间简短、内容丰富、随时随地可以观看,从而逐渐占领了用户的碎片化时间。用户呈指数化增长飙升,庞大的用户流量引起了电商行业与广告行业的兴趣,通过视频主播以合作代言的形式推广产品,形成了一种新的盈利模式。但是过亿级的用户量,会给电商和广告行业在寻找合作用户时带来困难,所以如果能够在庞大基数的用户中筛选出用户影响力较大的用户,或者能够发掘出有可能的电商潜在合作用户,就能够节省一定量的时间或成本。本次论文旨在从这个角度出发,对研究短视频行业与电商行业的快速融合有着一定的实践意义。本文首先阐述了社交网络中用户影响力计算的研究现状,介绍了基于粉丝数量的In-Degree入度算法以及基于Page Rank思想的关联算法,指出了他们所存在的一些不足,如Page Rank的关联算法中粉丝将PR值均匀分给关注的用户,存在不合理性。针对以上算法的不足之处,引出了基于微博网络平台的SF-UIR影响力算法,探讨SF-UIR算法在短视频平台的应用实现。通过实验将用户得到的影响力排序名次与该用户在因子分析得分排序中的名次进行对比分析,探讨用户的平台认证标签以及近期的作品内容质量所带来的影响力,并发现SF-UIR影响力算法可适用于短视频平台。随后为了生成可以判断用户电商潜质的用户分析模型,引入多标签的学习方式。阐述多标签学习的意义,对比单标签学习,多标签的学习方式能够更全面地掌握事物的规律和特征。随后说明多标签学习的两种方式,问题转换方法和算法转换方法。指出问题转换方法中存在的一些局限性;针对改进单标签算法并融入多标签学习的算法转换方法,阐述了ML-KNN、基于核函数的SVM、XGBoost模型的实现原理和使用策略,随后探讨三层BP神经网络多标签学习下的网络构建过程。通过实验对比以上算法模型在抖音用户数据集下的性能表现,发现XGBoost模型表现较好,是作为用户分析模型的更好选择。在用户分析模型的实验阶段,通过SF-UIR影响力算法与用户分析模型结合分析去发掘潜在的电商合作用户,尝试通过用户分析模型去发掘潜在的优质视频验分析,认为用户分析模型具有一定的用户影响力判别和潜在电商用户的发掘能力,也认为用户分析模型在短视频平台对潜在的优质视频作者有一定的发掘能力,但由于还不能克服短视频平台官方认证的多样化因素,对一些专业领域作者的判别分析上还存在着些许的不足。在本文的最后介绍了基于Fiddler4的短视频平台数据爬虫的实现方式,以及用户数据集的构建过程。