基于卷积神经网络的人体行为识别研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:ice_j88
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,以计算机视觉为基础的各种电子产品在人们的日常生活中起到了愈发重要的作用。而人体行为识别作为计算机视觉的重要课题之一,近年来成为了该领域的主要研究热点。本论文以基于视频的人体行为识别为研究课题,重点针对行为识别领域中亟待解决的关键性问题,如有效提取视频中的时空特征、解决视频中长距离依赖问题等,从以下两个方面对行为识别方法进行研究。1、基于双速帧率的时间金字塔网络的行为识别研究方法。人体行为是一个动态连续过程,每个行为动作具备其独特的运动节拍,这种特性使得不一样的行为动作具备不一样的视觉节奏信息。因此,本研究方法重点关注行为动作中的视觉节奏信息。在分析目前的三维卷积神经网络的基础上,本方法从数据输入和中间特征提取两个层面对行为动作的视觉节奏信息进行处理,提出了一种新的基于双速帧率的时间金字塔网络结构。其中,双速帧率模型采用改进后的ResNet-50网络作为主体网络,在数据输入层方面通过两路不同的视频采样速率对行为动作的高层信息和底层信息进行捕捉。与此同时,时间金字塔网络以双速帧率网络为骨干网络,在中间特征层方面加强时空特征的融合,进而促进整体网络的性能提升。通过在公开数据集上的实验验证,结果表明本网络模型的识别准确率优于同类型的其他网络模型。2、基于双速帧率的时间金字塔网络的优化研究。本方法针对时间金字塔网络中时域变速模块的特征提取方式过于简单,进而造成时空特征提取不够全面的问题进行改进。考虑到循环神经网络在长时间视频时域建模中的优异表现,本研究方法采用卷积长短期记忆网络(ConvLSTM)以及卷积门控循环单元(ConvGRU)来改进时间金字塔网络中的时序速率调整模块,进而加强时空特征融合。实验结果表明,通过ConvLSTM改进的时间金字塔网络最为优异,可以表现出比原先更好的识别效果,证明了本方法的有效性和可行性。最后,对本论文提出的行为识别方法进行总结,提出今后可以改进的地方以及对未来行为识别领域的发展作出相应展望。
其他文献
传感器与检测技术是一门实践性很强的课程,而传统实验教学模式的弊端影响了实践教学的效果.将虚拟仿真技术导入课程实验教学环节,并对虚实结合的新型实验教学模式进行了应用探索.新的教学模式打破了时间和空间的限制,拓展了实验的广度和深度,使学生能够直接面对实际工程应用问题,展开创新设计、系统构建和结果验证,打通了理论知识和实践应用的通道.学生在解决实际工程问题的过程中,工程技术素养得到全面提升,为其成长为具备创新能力的应用型技术人才奠定了基础.
中职学校美育与德育都是当前教学中的重点内容,对学生全面发展具有重要作用,美育与德育本身具有一定的相通性,可以尝试将二者结合,使二者互相促进,提升美育教学与德育教学的效率.但是从当前的教育情况来看,其中仍然存在很多不完善的问题,教育主体单一、教育内容单调等都会影响德育和美育教学的开展,需要从教育手段、教学主体以及教学内容等不同方面进行创新和改革.主要对中职学校美育教学中德育教学的渗透方式进行具体分析.
随着我国职业教育改革的持续性推进,使得大量现代化的教学手段被应用到专业教学中,其中信息化教学极大提升了中职计算机课程的教学效率,拓展了教学资源,构建了完善的教学体系.在中职学校计算机课程教学中,通过线上线下相结合的混合式教学模式,弥补了传统教学模式的诸多局限性,扩展了计算机课程的教学资源,打造了理实一体化的教学体系,为学生的全面发展打好了基础.通过探讨中职学校计算机课程线上线下混合式教学模式的实施策略,为相关工作的开展提供参考.
社会公德是每个公民的立身之本,同时也是促进社会可持续发展的重要基础.作为我国未来社会建设的主力军,中职学生要树立良好的社会公德意识.所以,中职学校要充分做好社会公德教育工作,这样一来才可以更好地推动学生健康、快乐成长,可以更好地促进我国精神文明建设,可以更好地构建和谐社会.