论文部分内容阅读
随着科学技术的快速发展,人们的生活方式发生了翻天覆地的变化。目前,人们对于外界信息的获取,不再只限于电视、报纸等传统媒体,网络已经成为了人们看世界的重要方式。面对网络上各种海量的视频数据,人们需要对它们进行管理,从而行之有效地从中获取所需信息。在此背景下基于内容的视频检索也就成为了研究的热点。视频场景边界检测是基于内容的视频检索中的关键技术。对于视频场景进行分割,需要将无结构的视频数据进行结构化处理,得到视频片段、场景、镜头和图像帧这几个层次。人们在观看视频时,一般着重从视频场景的层次了解视频内容,而不是从视频镜头这个层次。究其原因,镜头在结构化的视频中仅仅是一个物理单元,它不能描述出完整的视频内容信息,场景则是镜头的集合,包含更丰富完整的内容信息。因此,视频场景边界检测的研究也更具现实意义。该文提出了基于关键帧复杂度场景边界检测算法。首先,针对视频帧的背景及目标分布情况,计算视频帧的边缘比率,选择一个合适的阈值,判断其为高边缘比率或者是低边缘比率;然后,结合直方图分析视频帧的灰度一致性,采用多种合适的滤波算法,对待检测的视频帧做灰度一致性分析;再次,根据视频的几种移动方式,包括水平移动、垂直移动以及推拉,计算相邻视频帧对应像素之间的关系,得到目标图像各个方向的运动矢量与平均值差异;根据获得的相关目标点的方向和速度,速度量化成预先制定的相关等级,对于运动方向也划分为常用的八个方向,计算速度和方向直方图,从而获得该目标图像的速度熵和方向熵特征;最后,该文在获得视频帧复杂度测度的基础上,采用支持向量机的算法对视频场景进行训练以及分割,从而获得有效地视频场景边界。实验结果表明,该文基于关键帧复杂度的视频场景边界检测算法能较好地检测出有效场景,查全率以及查准率要高于文献[25]和文献[26]提出的算法,查全率和查准率分别能达到99.8%和96.4%。