论文部分内容阅读
观看体育节目已经成为现代人生活娱乐的一种主要方式,随着体育视频节目的飞速膨胀,如何帮助用户找到他们感兴趣的比赛或比赛的精彩片断,成为一个亟待解决的问题。人工处理视频以生成用户所需的比赛集锦不仅耗时、耗力,还需要专业技术。因此,进行体育视频分析,及自动生成比赛集锦的视频摘要技术的相关研究,一直是视频处理领域的热点问题。
对视频内容的理解是复杂、模糊并且具有歧义的,对于同一段视频每个人的理解可能不同,即视频语义分析和情感理解是因人而异的。究竟何为视频精彩片断,对此至今未有严格的数理模型定义。体育比赛项目众多,各有其不同的特点,限于当前的技术水平,还难以建立通用的体育视频分析模型。但是对于某一特定类型的体育比赛视频,通过结合相对应的领域知识,是可能建立起底层特征到高层语义之间某种联系的。基于此,本文针对足球视频展开分析,通过对视频镜头进行分割、慢镜头检测、镜头分类、精彩事件检测等工作最终定位视频精彩片断,并生成视频摘要。
首先,基于对足球视频中镜头切换类型的分析,提出了一种慢镜头检测优先的镜头分割方法。通过logo模板匹配法优先检测出视频中的慢镜头部分,再在余下的正常比赛部分检测突变镜头边界,完成视频镜头分割。紧接着,对正常比赛部分的镜头做进一步的分类工作。由于不同类型镜头所对应的图像帧中场地绿色所占的比率不同,本文在此镜头分类方法的基础上,改进了自适应场地色提取算法,结合黄金分块法并利用SVM分类器将正常比赛镜头划分为远镜头、中镜头、特写镜头和场外镜头三类。然后,在视频镜头分割和分类工作的基础上,通过分析精彩事件发生时镜头类型的转换规律,总结出精彩事件检测规则,基于规则检测视频中的精彩事件从而定位精彩片断,并利用DirectShow平台下的DES功能完成视频摘要的生成。最后,本文以Visual C++和DirectShow为开发工具,实现了一个足球视频分析及摘要原型系统。实验表明,本文提出的算法在足球视频镜头分割、镜头分类、视频摘要的生成方面具有良好的效果。