论文部分内容阅读
数字信息时代的到来使人们可以很方便的获取到大量的视频数据,如何对这些数据进行高效检索成为一个急需解决的问题。基于内容的视频检索(Content Based Video Retrieval, CBVR)技术因此应运而生。在基于内容的视频检索中,一般要进行的第一个步骤就是将视频序列分割为基本的镜头,即进行镜头检测。镜头检测的任务就是将视频序列按照时间和空间的变化分割成一个个基本的镜头。镜头边界可以分为两种,一种是突变,一种是渐变。在突变中,两个镜头是直接连接在一起实现的,镜头之间没有使用任何的视频边界特效;而在渐变中,使用了多种镜头编辑方法,使得镜头间的连接和过渡更加自然、紧密、美观。渐变又可以细分成淡入淡出(fade)、融合(dissolve)、旋转(spin)、翻转(wipe)等等。一般而言,对于渐变边界的检测的难度要大于对突变边界的检测,这也是镜头检测中的关键点。关于镜头边界检测,目前已经提出了许多的算法。总的来说,在目前已经提出的算法中,对于突变边界的检测已经达到了相当高的检中率和查准率,但是对于渐变边界,还没有一种算法能够取得非常好的效果,而渐变边界比突变边界往往具有更深刻的语义信息。信息论是运用概率论与数理统计的方法研究信息、信息熵、通信系统、数据传输、密码学、数据压缩等问题的应用数学学科。镜头的变化本质上就是信息的变化,因此,研究人员也采用了信息论的观点来进行镜头边界检测。基于信息论的观点来进行镜头检测的方法相对其它算法直观高效,在镜头检测中取得了不俗的成绩,但是在渐变镜头中出现频率非常高的镜头渐变尤其是镜头融合显得力不从心。因此,我们在这方面进行了一些研究,在信息论的基础上,提出了一种结合信息论和运动信息的镜头检测算法。本文的研究成果如下:1、详细介绍了基于信息论的镜头检测方法,并指出了其在镜头渐变检测上的不足,提出了改进的方案。2、对运动预测在镜头检测中的作用进行了分析,指出了其不足和优势,并在交叉菱形—六边形搜索法基础上,提出了一种有限的双交叉菱形—六边形算法,并将其应用到了镜头检测当中,该算法能够以较少的搜索次数获取像素块的运动信息,而不是极端的追求完全匹配的像素块。3、针对现有基于信息论的镜头检测方法中存在的问题,提出了一种结合信