论文部分内容阅读
人体动作识别是计算机视觉领域的核心研究方向之一,在很多场合都有应用。深度卷积神经网络在静态图像识别方面已取得了巨大成功,并逐渐扩展到视频内容识别领域,但应用依然面临很大挑战。为此提出一种基于ResNeXt深度神经网络模型用于视频中的人体动作识别,主要包括:①使用新型ResNeXt网络结构代替原有的各种卷积神经网络结构,并使用RGB和光流2种模态的数据,使模型可充分地利用视频中动作外观及时序信息;②将端到端的视频时间分割策略应用于ResNeXt网络模型,同时将视频分为K段实现对视频序列的长范围时间结构