论文部分内容阅读
数字视频属于国家重点发展的信息产业领域,宽带网络和数字电视的迅速发展,使得视频点播、交互电视、视频网站等应用都将面临大量涌现的数字化视频数据,对视频摘要技术的研究对基于视频的各种应用就具有重要意义。但视频摘要是近年来新兴的技术,国内外的研究还存在很多不足,从而限制了视频摘要技术的广泛应用。 本课题研究的目的在于通过分析视频中的音频信息,提取出从音频信息中反映出的精彩事件,从而对相应视频内容进行摘要。 本文以足球视频为例,分析计算了视频中对应的音频信息的一些音频特征,并利用这些音频特征设计了本系统实现的算法。本文研究内容主要包括以下几个方面: (1)研究了足球视频中声音随着球场事件的变化情况,提出通过分析音频信号短时能量变化来生成视频摘要的算法。 (2)采用对音频数据先滤波后分析的办法,减少了噪音对摘要结果的影响,根据滤波后不同频段的音频信号能量变化剧烈情况不同,给出了自适应生成视频摘要的计算方法。 (3)通过检测精彩片段出现时是否出现哨音,区别射门事件和犯规事件,并分析该处能量曲线的变化,给出了判断射门球进与否的计算方法。 (4)分析了设置不同的能量阀值时,对摘要结果的影响,并且分析设置不同的能量均方差阀值时,对判断射门是否球进的影响。 本文中由实验得到的结论反映了足球视频中音频信息的一些特性,为把视频摘要技术进一步应用到其他体育节目视频中提供了理论基础;对音频数据先滤波后分析的计算方法,以及对音频信号短时能量与能量变化剧烈情况分析后联合计算摘要结果的方法,对基于音频分析的视频摘要系统设计提供了一定的参考价值。