论文部分内容阅读
随着网络通信技术和多媒体技术的发展和信息需求的不断增长,多媒体信息已经成为各类信息系统的主要数据来源形式。其中,视频在网络多媒体元素中的地位与日俱增,如何快速准确的对海量的视频特别是一些特殊场景的视频进行分析和检索变得越来越重要。当前,网络视频的分析难点主要在于视频数据量很大,场景丰富,里面的物体种类和数量都很多,而且如何分析视频中的高层语义以及发生的事件更是难点。TRECVID作为视频检索领域最具权威的国际评测之一,已经开始关注这些极具潜力的研究方向。本文的研究课题正是来源于该评测中的事件检测,主要着眼于评测中机场视频的逆向走事件检测,提出了一种基于运动分析的无需训练、快速便捷的实时在线检测方法。本文的运动分析在用帧间差分进行运动检测的基础上,具体以图像局部特征角点作为运动物体的特征,再用光流法来获得对目标的运动方向和速度的预测结果。综合考虑视频中运动分析的结果,最终通过判断队列检测并记录场景中的逆向走事件发生的时间段。实验结果表明,本系统在“逆向走”事件检测中,具有较快的处理速度,保证了系统的实时性,同时在检测效果上,也达到了TRECVID国际评测的平均水平。此外,本文还加入相对较为简单的实验室出入口场景进行对比测试,所得的检测效果比机场场景有了较大幅度的提升,检测速度也进一步加快。总体来说,本文所提出的方法,避免了对视频数据进行大规模的训练,同时可以保证不错的检测效果,对于类似事件的实时检测与分析具有很高的研究价值。