论文部分内容阅读
随着计算机处理速度、数据压缩率、网络传输速度的快速提高,人们能够制作、获取和保存大量的多媒体数据。这些信息中,应用最广泛、最容易被接受与传播的就是以视频为代表的多媒体信息。快速增长的视频数据对数据的存储、传输、处理等技术提出了严峻的挑战,于是引发了从硬件到软件、从通信到信息处理、从搜索到信息共享等各个研究领域的技术革新,甚至是新问题、新技术的出现。其中,视频内容分析就是一个非常重要的研究问题。经过十多年的研究,人们发现任意类型的视频内容分析是一件相当困难的事情。视频种类繁多,每一种都其自身的特点,想找到一种通用的内容分析方法是非常困难的。于是,人们改变了研究思路,开始针对不同类型的视频数据,研究它们各自的特点,并针对这些特点,设计专用的内容分析方法。其中,体育视频(尤其是足球体育视频)就是一类受到普遍研究的多媒体数据。本文针对足球体育视频内容分析问题,借助媒体信息处理、模式分类、计算机视觉等领域的基础理论,结合主题模型、目标检测与跟踪等方法,通过场景分析、目标检测、相机标定、轨迹提取、及策略分析等各个环节的探索,建立了一个足球体育视频内容分析的系统。本文所取得的主要创新性研究成果概括如下:(1)提出一种基于主题模型的足球场景分析方法,实现了足球语义角度上的视频结构化分析。首先,引入语义镜头分割与场景分析的概念。通过语义颜色的自动提取,按焦距与拍摄对象的不同对视频进行了分割与分类。进一步,将其中的远景镜头根据所拍摄场地区域的不同细分为六个不同的场景。为了提高场景分类的精度,提出了一种同时考虑空间信息与监督信息的主题模型,提高了场景分析的性能。(2)提出一种基于方向信息的场地线检测方法,有效提高了场地线检测的精度。首先,通过考虑现代足球场的一些新特点,提出了一个包含有越位辅助线的足球场地模型。通过方向信息的提取,有效地检测出这些场地线。进一步,通过跟踪视频中场地线,不仅有效提高了检测效果,还解决了场地线识别问题。(3)提出一种针对足球视频的连续相机标定方法,解决了非球门区的标定问题。通过考虑拍摄足球视频的主相机位置不变这个特点,提出了一个针对足球视频的连续相机标定算法。将球门区的标定结果应用到非球门区的标定过程中,解决非球门区标定物不足的问题,实现了相机的连续标定。(4)提出一种基于真实轨迹的策略分析方法,实现了足球专业角度上的进攻策略分析。首先给出了真实轨迹提取算法,然后通过对足球状态的分析定义了六种典型的进攻模式,并给出一个进攻模式识别算法。实验结果表明我们所定义的进攻模式从简洁性、清晰性和实用性等方面都要好于现有的方法。综上所述,本文将多媒体信息处理、模式分类、计算机视觉等领域的基础理论引入到体育视频的内容分析研究中,通过场景分析、目标检测、相机标定、轨迹提取、及策略分析等各个环节的探索,建立了一个足球体育视频内容分析的系统。所提出的算法不仅可以用于足球视频内容分析,还可以应用到其它领域中,为多媒体信息处理提供了新思路。