融合图像与声音信息的视频标注 - 论文文献免费下载 - 搜论网

融合图像与声音信息的视频标注

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户：zhengwq1969

【摘要】

：

随着互联网的兴盛和信息技术的飞速发展,大众媒体开始从以文字和图像为主的形式逐渐向以视频为主的形态演变,大量视频数据不断涌出。因此,能够高效、及时地进行视频分类和管理的视频标注成为时下一大热门。视频标注本质是序列到序列的转换[1],特点在于视频的内容信息并不能用割裂的一帧帧的图像数据来表征,而需要强调视频前后的连续性和关联性。此外,对于普通观众而言,视频中附加的声音信息同样是接收和理解视频内容的关键

【作者】

：

袁华张逸帆陈安皓

【出处】

：

电脑知识与技术

【发表日期】

：

2020年33期

【关键词】

：

视频标注 MFCC算法声音特征 3D特征

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着互联网的兴盛和信息技术的飞速发展,大众媒体开始从以文字和图像为主的形式逐渐向以视频为主的形态演变,大量视频数据不断涌出。因此,能够高效、及时地进行视频分类和管理的视频标注成为时下一大热门。视频标注本质是序列到序列的转换[1],特点在于视频的内容信息并不能用割裂的一帧帧的图像数据来表征,而需要强调视频前后的连续性和关联性。此外,对于普通观众而言,视频中附加的声音信息同样是接收和理解视频内容的关键要素。然而,现有的用于视频标注的神经网络大多没有利用声音信息来进行标注输出。对此,该文提出一种基于S2V

其他文献

基于Wide&Deep的广告点击率预测模型综述

广告点击率预估模型在前深度学习时代工业界大多使用训练速度快、可解释强的LR以及挖掘联合特征的FM模型。2016年google提出的Wide&Deep模型为之后的预估模型开辟了一条双网

期刊

深度学习广告点击率预估Wide&Deepdeep learningad click-through rate estimationWide&

会计方程几多解(散文诗)

“钢笔+数字+算盘+账簿＝会计”,这是一个古老的会计方程,也是一道永恒的会计命题。方程绝对有解,命题必定成立。前人早已验证,丝毫不用怀疑。粗略看去,似乎只有会计是个已知量

期刊

散文诗会计死无葬身之地题解行为轨迹道德观念资金运动经济运行脉动仪钓鱼钩

安正时尚IPO:人才流失严重并购整合不济

<正>安正时尚在上市之前曾进行过多次股权变更,公司喜欢通过以持股的方式吸引人才,但是却事与愿违,公司人才流失严重;此外,公司近年来相继进行了一些收购,但收购后的整合却成

期刊

办公室一族的十大饮食危机

期刊

饮食习惯早餐饮酒行为水果饮食结构人体健康

树立形象增强能力推进法定计量检定机构规范建设

法定计量检定机构是实现量值传递和进行计量检定等技术工作的重要保证，是政府计量行政部门对计量工作实施综合管理和行政执法的技术保障．是国家计量管理体系中不可缺少的组成部

期刊

法定计量检定机构计量管理体系计量法规法制观念质量意识

新《商检法》如何规范商检

首先．在立法宗旨中增加了“规范进出口检验行为”的规定。强调了商检法重要立法目的之一就是规范商检行为，维护国家利益。

期刊

《中华人民共和国进出口商品检验法修正案》检验行为规范化检验机构

侧丝架牵伸加拈机生产涤丙长丝初步探讨

期刊

牵伸加拈机涤丙长丝侧丝架涤纶

语文课程学法、教学与多媒体的应用与实践

多媒体教学以其巨大的容量、丰富的表现形式、直观的感受得到了人们的青睐。本文通过对中学语文多媒体教学中的形象性、科学性、直观性、可操作性、生动性和活泼性的阐述，对在

期刊

语文课程学法教学多媒体应用

激励行为在中职班级管理中的运用

近几年来,我国教育进入改革时期,并且随着社会主义现代化建设的不断深入,教育成本也开始显著下降,为了培养就业人才,我国中职院校的数量在急剧增加,各个学校也进入到了扩招的

期刊

激励策略中职班级管理运用

浅谈青岛市病媒生物防制的发展思路

病媒生物防制是一门有理论研究又有防治实践的学科,它面对的对象不仅是各级研究机构的科研和技术人员,而且还有国家卫生管理部门、杀虫剂、器械生产厂家和杀虫服务商,由于还

期刊

青岛市病媒生物防制发展思路媒介昆虫杀虫剂

其他学术论文