论文部分内容阅读
多媒体技术和计算机网络的发展,使我们很容易地获得大量的视频信息,如何从这些海量的视频信息中找到所需要的视频片断,是基于内容的视频检索(Content-basedVideoRetrieval)所必须面对的问题。要解决这一问题,就要对视频进行内容分析。视频分析技术包括镜头分割、关键帧提取和场景聚类。其中,视频镜头分割是关键帧提取和场景聚类的基础,其分割效果直接影响其后续的视频分析效果。因而视频镜头的分割是当前视频研究的热点之一。
当前,国内外对视频镜头分割的算法存在着算法繁琐、分割速度和准确性不高等缺点,难以投入实际运用。文中提出了一种基于窗口最大值和自适应阈值的镜头分割算法,该算法在现有镜头分割算法的基础上,选用颜色直方图作为度量特征,利用相邻帧间差曲线上的垂直“尖峰"特征来检测突变,并利用非相邻帧间差曲线上明显的“山峰”特征来检测渐变。同时引入滑动窗口,利用窗口帧间差最大值和自适应阈值对镜头的突变和渐变进行两次识别,将识别的结果进行统计合并,形成分割镜头集。自适应阈值由帧间差平均值与一个参数的积构成,它是一个实时的阈值,随着帧间差平均值的不同,在不同的分割时刻取不同的变化值以做到自适应。阈值参数是一个常量,是通过实验得出的。为了提高分割效率,该算法对标记为镜头的帧进行了优化,在一定程度上降低了漏检率和误检率。在突变检测中,考虑到镜头开始部分帧间差累积值太小,对镜头前5帧中标记为镜头的帧,采取了不予考虑的方案。
该算法简单,便于实现,易于使用。实验结果表明,该算法的镜头分割效果比较明显,相比传统算法在低开销情况下性能有显著的提高。