论文部分内容阅读
随着信息技术的突飞猛进,产生了大量的视频文档。视频压缩、视频编解码、计算机海量存储和信息高速传输等技术的发展解决了日益膨胀的视频信息传输和存储问题,如何对海量的视频数据进行高效的计算机处理,实现视频内容的索引、查找、分析、语义描述和压缩等成为现在关注的焦点。
目前一致公认的视频检索手段是视频内容结构化,即镜头检测,目前的镜头检测主要分为两大类,基于压缩域的镜头检测和基于非压缩域的镜头检测,由于基于压缩域的镜头检测计算较为复杂,而且准确率不高,目前研究较多的是基于非压缩域的镜头检测。先把视频解压,提取视频的帧特征,然后进行帧特征的比较,计算出帧间差值,根据帧间差值来判断镜头切换的位置。
本文研究和分析了视频镜头检测的多种算法,镜头切换分为渐变和突变,渐变又有很多种,一般的镜头检测算法对突变检测率较高,但是对于镜头的渐变,因为帧间差是缓慢变化的,帧间差异值较小,导致检测阈值难以确定,相比于突变检测,渐变检测率较低。目前的镜头检测研究主要是针对镜头渐变的检测,其中许多镜头检测算法只能针对某些视频有效,检测出某一类或几类镜头变换,有些只能检测突变,而不能准确的检测出渐变。由于视频复杂,渐变形式多,检测技术不成熟,目前还没有一个比较高效、检测率高的镜头检测算法普遍适合于所有视频,因此镜头检测还在不断的发展完善之中。
本文分析了当前镜头检测算法存在的问题,给出了自己的检测方法,提出融合多种特征的镜头检测,特别针对闪光问题,给出了相应的检测方法,论文主要工作归结为以下几点:
1.比较和分析了现有的基于像素、基于直方图、基于边缘检测等视频镜头检测算法的优点和不足;
2.将基于像素匹配的镜头检测算法与基于分块直方图的镜头检测算法相结合,给出了算法的模型,模型分为四个功能模块:视频解码、特征提取、闪光过滤和融合中心;
3.根据算法模型进行了算法设计,基于像素的特征能够很好的反应局部变化,基于分块直方图的特征能够很好的反应全局变化,通过结合两种特征进行检测以得到更准确的镜头切换位置;
4.过滤镜头中的闪光帧,对视频中出现闪光的帧进行了过滤,避免了因闪光而造成的误检;
5.最后对以上给出的镜头检测方法,用四段视频进行了实验结果与分析,分析了算法查全率、准确率和误检率。验证了本文方法的有效性;