论文部分内容阅读
随着互联网信息的爆发和技术的不断成熟,针对网络视频的应用得到了飞速的发展,其用户规模和数据量都呈现着海量式的增长。这些驱使着需要更有效的方法对视频内容进行组织和管理,来满足急剧增长的应用需求量和日趋多样化的需求方式。近年来,基于内容的在线视频概念检测已成为视频检索和分类等领域研究的热点,很多成果也运用到了实际的视频网站系统中。如何高效的建立视频内容中概念的通用性表征,和从低级视觉描述中抽象出高级语义特征,仍然是该项研究课题的最大挑战。 以视频中不同模态的信息为视角,我们调研了基于内容的不同视频概念检测框架下的各类研究方法。另外,我们介绍了随机采样技术在图像分类上的应用,作为其运用到视频概念检测中的可行性依据。 在低级视觉内容的描述上,我们提出了具有高效性和通用性的基于随机采样的时空图像块。一个基于随机采样的时空图像块被定义成在一个采样周期下与区域性时空特征(颜色,纹理,边缘,运动)相关联的一个随机图像块的跟踪。 在概念语义的提取上,我们通过概念码本的学习抽象出视频的高级视觉特征。我们利用多示例学习建构出概念码本,用于过滤低级视觉描述中的噪声和挖掘概念的语义特征。借助于概念码本的特征离散化作用,我们将视频的低级视觉描述映射到码本上,提取出视频的基于概念码本的高级视觉特征。 基于视频的高级视觉特征,我们对每类概念训练出一对多的SVM分类器,用于此概念的在线检测。我们从YouTube视频网站下载了913段视频作为本文实验数据集,其包含了21类日常性概念。通过概念检测实验证实,本文方法能够在保持有竞争力的检测效果上,实现概念的在线检测。