【摘 要】
:
随着网络视频平台的快速发展,产生了海量的视频数据,这给视频环境下的标签生成和相关审核工作带来了更多挑战。常见的视频标签主要是图像信息或静态文本信息,标签特征维度单一,且通常是视频整体的标签,难以通过标签对应到具体的视频片段,因此,标签的应用程度有限的同时,标签审核效率也不高。根据弹幕文本的聚集性、时序性以及与视频内容之间的相关性,本文通过对弹幕的文本分析,来完成对视频的数据挖掘,生成针对视频片段的
论文部分内容阅读
随着网络视频平台的快速发展,产生了海量的视频数据,这给视频环境下的标签生成和相关审核工作带来了更多挑战。常见的视频标签主要是图像信息或静态文本信息,标签特征维度单一,且通常是视频整体的标签,难以通过标签对应到具体的视频片段,因此,标签的应用程度有限的同时,标签审核效率也不高。根据弹幕文本的聚集性、时序性以及与视频内容之间的相关性,本文通过对弹幕的文本分析,来完成对视频的数据挖掘,生成针对视频片段的标签,提高对视频标签的审核效率。并以不同主题视频的弹幕文本为研究对象,进行了面向视频的弹幕分析和标签生成技术研究。具体研究内容和贡献主要如下:首先,本文提出了一种基于滑动窗口的文本密度聚类方法,将待聚类文本映射到向量空间,根据聚类对象的k邻近距离和k-dist曲线图来确定算法的最佳参数,以提升实验效果,并结合弹幕文本特征和时序信息进行了相似性密度聚类分析,按照时间顺序和滑动窗口将相似的弹幕划分到同一聚类簇。除此之外,本文还通过将聚类簇样本点根据时间信息进行排序,获得簇的时间边界点,并将其时间信息作为关键片段的开始和结束时间,以实现对视频片段的动态划分,定位视频关键片段。接着,本文对比了多种关键词提取技术,深入研究了其中应用较广泛的Text Rank算法,并针对弹幕文本特征,对Text Rank关键词提取算法进行了改进。其中,本文主要针对Text Rank图模型的节点边权关系进行了相关调整,计算了弹幕文本的语义相似性和情感值,提出了一种融合词向量和情感信息的关键词抽取模型。最后,为了更好地验证本文所提出的通过弹幕实现关键片段定位和视频标签生成的方法的有效性,本文采集了主流视频平台的主题视频弹幕文本,将其作为本文实验的数据集,并进行了文本分词和过滤等预处理操作。在处理后的数据集上运用所提出的算法进行文本聚类和关键词抽取。实验结果表明,针对面向视频的弹幕文本分析任务,所提出的算法比传统算法的效果更佳,具有精确率、召回率和F1值高的优点。本文的研究能够有效地实现基于弹幕的视频动态分段,获取有价值的关键词作为对应片段的视频标签,提高视频平台人员对视频标签的审核效率,为视频的弹幕文本分析和标签生成应用研究提供了新的思路。
其他文献
异丙醚(IPE)可以作汽油添加剂,解决含铅汽油问题,也可作化学工业上的溶剂,与异丙醇(IPA)混合溶解纤维,同时可以处理煤气厂污水来解决水污染问题。它可应用到医药中间体,也可应用至煤制溶剂或者制备生产香料等工业中。另外,异丙醚还可应用于腈纶硫氰酸钠的一步法萃取回收等。在一定条件下,它也可作为生产乙醇的一条可行的工艺路线。近年来,随着人们对异丙醚的优异性能的认识,为异丙醚的发展带来机遇。分子筛催化异
钢阻尼器是增强建筑物抗震性能的重要手段,它通过吸收外部振动能量,从而减弱振动对构件的影响,具有良好的消能减震效果。钢阻尼器在强震来临时通常需要承受高应变低周疲劳,这对阻尼器用钢(低屈服点钢,通常为(超)低碳铁素体钢)的低周疲劳性能提出了较高要求。铁素体钢在循环变形过程中交滑移频繁发生且塑性变形不可逆,在此过程中伴随着组织稳定性降低及应变局域化;随循环进一步进行,疲劳裂纹往往萌生于材料表面的应力集中
近年来,随着互联网和计算机技术的发展,各个领域的质检投诉数据积累越来越多,因此对质检数据进行分类的研究具有重要意义。目前主流的三种分类方法字典匹配、机器学习模型、深度学习模型均存在共性问题,字典匹配对于词库依赖度较高,机器学习模型和深度学习模型都需要较好的词嵌入表示。针对以上问题,本文基于质检领域数据将字典匹配、深度学习模型进行组合提出一种新的分类方法进行投诉文本的分类。主要贡献如下:(1)构建基
在信息技术快速发展的新形势下,高校围绕立德树人的根本目标,开展线上线下协同育人实践,助力青年大学生全面成长成才。但当前高等外语教学在评价环节存在模式传统僵化、以终结性评价为主、不关注综合素养、评价工具落后等弊端。外语教学工作者应结合多元智能和建构主义理论,通过混合多方主体、拓宽评价内容、融合信息技术工具、注重动态评价、发挥多元评价功能等途径,积极构建线上线下混动教学模式下的大学英语多元评价体系。
电子及电动(汽)车行业的发展产生了数量巨大的废旧锂电池,其中含有的重金属如镉、镍、锰等均会对人体产生毒性。同时,废旧锂电池中的这些金属,也是潜在的矿产资源。对锂电池进行有效回收可同时解决环境污染和资源缺乏问题。本文通过人工拆解与机械研磨获得了锂离子电池负极材料与塑料,将其与氧化铁通过碳热反应制备石墨负载零价铁(ZVI/G)、塑料基碳材料负载零价铁(ZVI/PP)、石墨及塑料基碳材料负载零价铁(ZV
随着深度学习的发展,常见的自然场景文本识别任务,在高效管理数据领域和准确性方面都取得重大突破。但是在异构物流票据中,其版面庞杂,种类繁杂,缺乏统一的票据模板来检测异构票据信息。针对章印遮盖文字信息以及发票内容因印刷产生偏差的情况,物流票据文字识别技术对精确率有着更高的要求。因此,相较于普通的文字识别来说,异构物流票据信息识别具有更高的难度。为此,本文开展的异构物流票据环境信息的提取与识别分析技术研
扣件系统是地铁轨道的重要组成部分,其中,弹条是扣件系统中最为关键的连接部件,直接对钢轨实施扣压力和防爬阻力,保证钢轨、轨距以及轨道几何形位的稳定性,防止轨道发生不利变形。弹条断裂失效会导致轮轨作用力加剧,加速轨道和车辆的破坏,危及行车安全。本文针对地铁常用e型弹条扣件系统,基于数字图像相关法对弹条成型前材料进行了拉伸试验、缺口试验,弹条元件及组装模态进行了室内测试,基于室内疲劳试验过程对弹条进行了
近年来,我国的信息技术飞速发展,越来越多的多媒体教学被广泛应用。这为学生的自主学习提供了诸多便利条件,展现出以学生为主体,教师为主导的新型教学模式。教学效果的展现以评价为主要方式,大学英语的考核依据高等教育大学英语教学大纲,设定教学目标,考量评价主体,评价内容,评价方式及评价策略等诸多因素。本文提出,在原有结果性终结性评价基础上,全新构建大学英语学习的多元评价体系,即过程性形成性评价。通过全过程地
教学评价是课程改革、教学实施、学情反馈的重要环节,对教学效果发挥着诊断和导向的多重作用,科学的评价体系是课程建设与发展的重要保证。本文基于新《大学英语课程指南》要求,借鉴多元智能评价理论,结合应用型本科院校大学英语教学评价客观现实,旨在构建大学英语教学多元评价体系,并通过实证研究,验证该评价体系在教学实践中的有效性和科学性。
剪切板阻尼器是被动减震中金属阻尼器的一种类型,有良好的耗能能力和减震效果,在减震领域有广泛的应用。剪切板阻尼器通常使用常规的几种低屈服点钢,材料选择性较少且功能性比较单一。本文研究了上海材料研究所自主研发的TRIP-IF复合钢基本力学性能,观察其是否适合用于减震领域,并利用该材料设计了两种新型剪切板阻尼器,期望能够得到一种延性高,耗能性能好,不容易发生面外屈曲,且具有双阶段屈服效果的剪切板阻尼器。