基于内容的在线视频概念检测

来源 :北京大学 | 被引量 : 0次 | 上传用户:zhang_jun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网信息的爆发和技术的不断成熟,针对网络视频的应用得到了飞速的发展,其用户规模和数据量都呈现着海量式的增长。这些驱使着需要更有效的方法对视频内容进行组织和管理,来满足急剧增长的应用需求量和日趋多样化的需求方式。近年来,基于内容的在线视频概念检测已成为视频检索和分类等领域研究的热点,很多成果也运用到了实际的视频网站系统中。如何高效的建立视频内容中概念的通用性表征,和从低级视觉描述中抽象出高级语义特征,仍然是该项研究课题的最大挑战。  以视频中不同模态的信息为视角,我们调研了基于内容的不同视频概念检测框架下的各类研究方法。另外,我们介绍了随机采样技术在图像分类上的应用,作为其运用到视频概念检测中的可行性依据。  在低级视觉内容的描述上,我们提出了具有高效性和通用性的基于随机采样的时空图像块。一个基于随机采样的时空图像块被定义成在一个采样周期下与区域性时空特征(颜色,纹理,边缘,运动)相关联的一个随机图像块的跟踪。  在概念语义的提取上,我们通过概念码本的学习抽象出视频的高级视觉特征。我们利用多示例学习建构出概念码本,用于过滤低级视觉描述中的噪声和挖掘概念的语义特征。借助于概念码本的特征离散化作用,我们将视频的低级视觉描述映射到码本上,提取出视频的基于概念码本的高级视觉特征。  基于视频的高级视觉特征,我们对每类概念训练出一对多的SVM分类器,用于此概念的在线检测。我们从YouTube视频网站下载了913段视频作为本文实验数据集,其包含了21类日常性概念。通过概念检测实验证实,本文方法能够在保持有竞争力的检测效果上,实现概念的在线检测。
其他文献
现代处理器通常采用动态指令调度超标量流水线来发掘程序中的指令级并行。但是访存指令——尤其是装载指令——需要较长的执行延迟,从而阻塞了流水线中其他指令的动态执行,因此
Web技术已经广泛应用于人们的工作和生活中,随着Web技术的快速发展,各类安全问题也越来越突出,其中SQL漏洞注入攻击已成为Web安全问题中最具有危害性的问题之一。本文研究SQL
随着汽车数量的大幅增多,道路拥堵、交通事故等问题不断增多,智能交通系统(Intelligent Transport System,ITS)也因此成为了未来道路交通系统的发展方向。智能交通系统中最重要
以智能手机、平板电脑为代表的移动设备和以Wi-Fi、3G为代表的移动网络的日益普及,为移动多媒体通信服务的开展提供了条件。然而,移动设备的低功耗特性限制了其对计算资源的过
自然景物是三维游戏、商业广告、数字娱乐、城市规划、树木的应用研究以及虚拟城市中必不可少的重要组成部分,对自然景物的三维可视化模拟一直以来都是虚拟现实领域中的一个研
移动网络的快速发展正在逐步改变着人们的生活。随着移动带宽的增长和移动终端的普及,越来越多的数据从移动设备产生。这些移动数据有不同于互联网的新特性,比如数据普遍较小但
在当前计算机领域,需要处理的数据维数越来越高,作为一种有效的降维方法,特征选择得到越来越多的关注。  本文回顾了常见的几类特征选择方法:基于判别性信息的特征选择、保持
由于3D建模和数据捕获技术的发展,三维模型的复杂度呈现出极为快速的增长。如何在可交互速率下实时绘制大规模的几何模型成为了计算机图形学领域很有挑战性的问题之一。大规模
利用计算机技术实现的树种检索系统已是林业人员必不可少的鉴别树种工具。由于现存树木种类繁多,系统响应时间是树木检索系统的一个重要性能指标。通过对现有的树种检索系统
Named Data Networking(NDN)是一个新提出来的未来互联网体系结构。它被认为是传统TCP/IP技术的一种全新替代。和传统的基于连接的、点到点的数据传输模型有所不同,NDN采用了