论文部分内容阅读
多媒体信息技术和互联网的发展给人们带来了丰富的视频资源,如何对海量的数字视频信息进行有效管理、组织和检索成为图像处理以及信息检索领域中的热门研究课题。由于传统的基于文本的视频检索系统不能有效提取视频中的内容信息,在这种背景下,基于内容的视频检索技术逐渐成为了国内外相关领域的研究热点。
本文首先基于视频流的结构化建立了通用的基于内容视频检索系统的组织框架,随后对基于内容视频检索中的关键技术:特征提取、镜头分割和关键帧提取技术进行了较为深入的研究。针对特征提取技术,本文对视频的多种特征进行了分析并重点研究了视频图像的颜色特征,在选取合适的颜色空间模型后,通过加入人的视觉感知因素来改进颜色量化过程,使检索性能更优,接着本文在总结典型的颜色特征提取算法基础上提出了相邻直方图相加的算法,有效解决了全局直方图量化边界处颜色量化区间不确定性的问题;视频镜头分割技术包括对镜头切变和渐变的检测。针对镜头的切变,本文利用信息论中的相关知识结合图像分块技术,提出了基于分块图像互信息量的镜头分割算法。图像间的互信息量同时包含了像素点的位置信息和直方图的统计信息,相比于传统的镜头分割算法,能降低物体运动和噪声带来的影响,而基于等面积圆形的图像分块法则解决了传统矩形分块法不能达到突出主体,弱化无关背景的不足之处。随后,本文利用间隔若干帧的图像间互信息量来检测镜头的渐变,对于相邻图像特征变化较小的渐变过程,能有效提高镜头渐变检测的准确率。在阈值的选取上,本文提出了一种基于高斯模型和滑动窗口的局部自适应阈值,相比于全局阈值,更好地适应了镜头内容的变化,降低了镜头的误检和漏检。随后本文进行了多种算法的镜头分割对比实验,实验结果验证了本文提出算法的优越性和可靠性;针对镜头中关键帧的提取,本文提出了一种基于互信息量均方差的关键帧提取算法,该算法首先计算镜头内互信息量的均方差来判断镜头的波动程度,接着利用镜头分割和迭代的思想来分段提取关键帧,实验结果表明,相比其他传统的关键帧提取算法,本文算法提升了关键帧提取的准确性。
本文首先基于视频流的结构化建立了通用的基于内容视频检索系统的组织框架,随后对基于内容视频检索中的关键技术:特征提取、镜头分割和关键帧提取技术进行了较为深入的研究。针对特征提取技术,本文对视频的多种特征进行了分析并重点研究了视频图像的颜色特征,在选取合适的颜色空间模型后,通过加入人的视觉感知因素来改进颜色量化过程,使检索性能更优,接着本文在总结典型的颜色特征提取算法基础上提出了相邻直方图相加的算法,有效解决了全局直方图量化边界处颜色量化区间不确定性的问题;视频镜头分割技术包括对镜头切变和渐变的检测。针对镜头的切变,本文利用信息论中的相关知识结合图像分块技术,提出了基于分块图像互信息量的镜头分割算法。图像间的互信息量同时包含了像素点的位置信息和直方图的统计信息,相比于传统的镜头分割算法,能降低物体运动和噪声带来的影响,而基于等面积圆形的图像分块法则解决了传统矩形分块法不能达到突出主体,弱化无关背景的不足之处。随后,本文利用间隔若干帧的图像间互信息量来检测镜头的渐变,对于相邻图像特征变化较小的渐变过程,能有效提高镜头渐变检测的准确率。在阈值的选取上,本文提出了一种基于高斯模型和滑动窗口的局部自适应阈值,相比于全局阈值,更好地适应了镜头内容的变化,降低了镜头的误检和漏检。随后本文进行了多种算法的镜头分割对比实验,实验结果验证了本文提出算法的优越性和可靠性;针对镜头中关键帧的提取,本文提出了一种基于互信息量均方差的关键帧提取算法,该算法首先计算镜头内互信息量的均方差来判断镜头的波动程度,接着利用镜头分割和迭代的思想来分段提取关键帧,实验结果表明,相比其他传统的关键帧提取算法,本文算法提升了关键帧提取的准确性。