论文部分内容阅读
近年来,随着计算机多媒体技术和网络通信技术的发展,基于内容的视频检索、访问的应用越来越广泛。而由于视频数据的内容丰富性、数据非结构化性使得视频浏览检索的效率、方便性均存在较大不足。如何快速、高效地把视频数据中包含关键信息的数据提取出来,是视频进行快速检索、存储管理、递送等应用的关键技术点。应用基于内容的视频摘要自动生成技术就可以实现视频数据结构化、视频数据重要信息提取,从而提高视频的检索、管理效率,对基于内容的视频应用具有重要意义。本文在对现有的视频结构化、视频内容分析等技术的基础上,对基于内容的视频摘要自动生成技术进行了研究。本文的主要工作和内容如下:详细总结了与基于内容的视频摘要相关的理论、系统的发展状况。结合国内外在视频结构化分层领域的研究成果,引出了本文基于内容的视频摘要生成的方法,并阐述了一种层次视频摘要系统框架。总结和分析了已有的文献中的一些镜头边界检测算法,并对它们的优缺点一一进行分析。针对模板匹配法、直方图法、亮度特征法的特点和不足,利用图像的时间和空间特征在镜头转换边界的变化特点,提出了一种改进的基于时间特征和空间特征的镜头边界检测方法,通过实验证明了本文算法能够准确有效地检测出视频镜头转换边界。为了能够有效地提取细粒度的视频摘要,本文在镜头边界检测的基础上研究了一种改进的基于空间特征显著变化的关键帧提取方法。在总结K均值算法应用在视频镜头聚类场合不足的基础上,提出了一种改进的适用于镜头聚类的K均值聚类算法。最后在分割好的场景中提取代表帧,生成粗粒度的视频摘要。