【摘 要】
:
随着移动互联网的发展,越来越多的用户通过移动终端,使用数据流量观看视频。用户在观看移动视频的同时,产生了大量的行为数据。从用户的行为数据中分析用户的属性信息,挖掘用
论文部分内容阅读
随着移动互联网的发展,越来越多的用户通过移动终端,使用数据流量观看视频。用户在观看移动视频的同时,产生了大量的行为数据。从用户的行为数据中分析用户的属性信息,挖掘用户的兴趣和偏好,会帮助网络运营商和视频提供商改进服务质量。本文提出了一种基于用户行为数据和视频评论文本的移动用户画像构建方案。该方案不依赖特征工程准确预测用户的个人属性,并且设计了层次标签体系描述用户的兴趣偏好。提出了一种共嵌入注意力网络模型用于预测用户的年龄和性别。该模型首先分别从用户观看记录和视频评论文档中,学习视频的观看向量和评论向量;之后结合两个向量作为视频特征,并引入注意力机制,构建共嵌入注意力网络;最后将用户的视频观看记录输入到网络中预测用户的属性信息。在性别预测和年龄预测两个任务中,共嵌入注意力网络分别取得了91.6%和56.4%的F1-score。提出了一种视频的粗粒度标签获取算法。该算法构建了层次注意力网络,学习评论文本中单词和评论的权重;最后预测所有标签的置信度并确定视频的一级标签。此外还提出了基于文档重构的样本均衡法,解决样本分布不均衡问题的同时利用了更多的文本信息。视频粗粒度标签获取算法在标签推荐任务上取得了78.05%的召回率,性能优于主流文本分类算法。提出了一种无监督的融合标签抽取算法。为了获取视频的细粒度标签,该算法分别通过TF-IDF算法和改良的Text Rank算法从视频评论中抽取两组标签,之后利用投票法确定视频的二级标签。问卷实验的结果表明,融合标签抽取算法获得的标签能更准确描述视频。最后,基于一级标签和二级标签构建视频层次标签体系,并结合用户的观看记录建立了移动视频用户的兴趣标签画像。
其他文献
随着智能手机等移动电子设备的快速发展与普及,如今已进入全民摄影时代。由于摄影条件和摄影者自身美学鉴赏能力的差异,所拍摄图像的美学质量也呈现出较大的差异。为满足人们
目的:共词聚类分析结果的表达是共词分析应用的最后一步。现有的共词分析结果表达的方法均具有一定的局限性,所得到的结果存在主观性较强及表达不全面等问题。本研究提出基于
随着近几年的发展,深度学习方法在许多人工智能应用领域取得了极大的突破,例如计算机视觉和自然语言处理。其中在计算机视觉领域,不同于传统方法依赖的手工特征提取,深度学习由于其端到端训练的特点,和优越的特征提取性能,近几年以卷积神经网络为代表的深度学习方法几乎在所有计算机视觉子领域都取得了重大突破,极大地推进了这些研究领域的发展。在本文中,基于卷积神经网络,我们将聚焦计算机视觉领域中两个重要任务:图像识
近年来,灾害事件、恐怖袭击频发,使得搜救机器人逐渐成为机器人产业中受到较大关注的一个分支。搜救机器人凭借其自身结构特点可以在战后、灾后(地震、火灾、恐怖袭击等)未知
土地是农业的根本,农用地的数量、质量、利用情况及其空间分布等信息是构成农业信息资源的基本要素和重要基础。对农用地数据进行精确采集和动态跟踪管理,是实现现代农业生产
随着2019年《政府信息公开条例》的修订,过程性信息正式作为政府信息存在的形态之一,被纳入“可以不予公开”的范围之中。但是在目前的法律制度中,过程性信息的概念界定模糊,公开与否的认定标准不一,对信息公开的具体实践造成困扰。因此,对过程性信息的豁免公开作出合理认定有着重要意义。合理构建过程性信息豁免公开的认定体系,首先需要明确过程性信息豁免公开的理论基础。为了保障行政机关内部坦诚交流、保证行政效率与
信息技术的发展给人们带来了不少好处和便利,但是信息安全和版权保护问题同时也变得益发突出。数字印刷品作为信息交互的重要方式,其版权保护和信息安全也越来越受到重视。数
本文主要进行了两项工作:一是对中心-外围模型(Center-Periphery Model,一般简称C-P模型)进行推广并建立理论模型。本文在标准C-P模型中引入了政府部门,进而探究在农业部门,
随着互联网信息规模的急速膨胀,对大规模数据进行快速处理、学习和挖掘的需求也变得越来越多。在许多真实应用比如社交网络中,具有图结构的数据的规模也在不断变大。因此,基于图计算的大规模分布式(并行)机器学习框架受到了越来越多的关注。一方面,许多数据间的依赖关系可以自然地用图来进行建模,而且许多数据本身就具有图或网络的结构,例如社交网络数据;另一方面,许多机器学习和数据挖掘的算法也可以用图或网络来建模。在
常压容器作为化工产品生产、存储及运输的常用设备,具有广泛的应用需求。危化产品常压容器罐底经长期使用后极易出现腐蚀减薄、电化学腐蚀等结构性缺陷,极大增加了化工产业的