基于深度学习的行为识别方法研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:hanyan0503
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着视频理解研究的不断深入和应用范围的不断扩大,行为识别任务逐渐成为相关领域的研究热点之一。大多数应用场景中计算资源有限,为了追求高准确率,目前的行为识别方法趋向于使用越来越复杂的结构,这极大地限制了行为识别在现实生活中的应用。因此,本文对基于深度学习的行为识别方法做了详细研究,在保证准确率的同时,着力降低方法的复杂度,以满足行为识别方法在现实生活中的应用条件,具体完成如下工作。首先,针对部分轻量级三维卷积神经网络在行为识别任务中准确率低的问题,提出了3D-Efficient Net,实现对视频时空信息的直接提取。该方法把二维卷积神经网络的卷积核在时间维度扩张,得到三维卷积神经网络,并利用较小的卷积核代替较大的卷积核的方式提高该神经网络的运行速度。其次,探究了在行为识别任务中扩大输入图像分辨率、提高网络宽度对行为识别准确率和速度的影响。实验结果表明,提高网络的宽度和扩大输入图像的分辨率会使准确率的提高,但同样会导致运行速度变慢。再次,针对2D卷积神经网络对空间信息格外敏感却无法捕获时间信息,而3D卷积神经网络能够捕获视频中的时空信息,但参数和运算量较高的问题,结合2D和3D卷积,提出了基于2D/3D混合的行为识别方法。该方法由特征变换子模块提取特征图,随后将特征图堆叠起来输入到时空3D卷积子模块中,在减少运算复杂度的同时,提升行为识别的识别效果。最后,在UCF-101数据集的101种行为类别以及HMDB51数据集的51种行为类别上,对模型进行验证。实验结果表明,与其它方法相比,本文提出的行为识别方法表现出了更高的识别准确率和更快的识别速度。
其他文献
本文利用不同希尔伯特空间的粒子构成的非对称量子通道,进行了多方和控制量子密集编码的研究,在多个传送者一个接收者的量子密集编码方案中,本文提高了传送的经典信息量;通过借助投影测量,实现了一个传送者多个接收者的量子密集编码方案,在控制量子密集编码方案中,我们利用非对称的多体纠缠态,给出了一种量子控制经典信息量的方法,调控经典信息量在粒子信息容量和量子信道容量之间浮动。
心血管疾病Cardio-Vascular Disease(CVD)是全世界主要的死亡原因之一,预计到2025年将有2360万人受到CVD的攻击。因此,医疗保健行业的建立旨在收集大量的心血管疾病CVD信息,通过对这些信息的挖掘分析以帮助医生检测和识别CVD的潜在危险因素。Deep learning algorithms可以根据这些结构化和非结构化的病例信息来帮助发现疾病和症状的潜在模式。在流行病学中
骨髓间充质干细胞(BMSCs)具有强大的增殖能力及多向分化潜能,而中医"肾藏象理论"认为肾藏精,精能生髓,髓能养骨、充脑,且可化生天癸,主宰生殖,二者在主宰机体的生理活动和病理变化方面有着诸多相似之处。现代研究表明补肾中药能促进BMSCs增殖并诱导其定向分化为成骨细胞、神经细胞、生殖细胞,基于补肾中药干预BMSCs增殖分化的研究现状来探讨其与"肾藏精"、"肾主骨"、"肾生脑"、"肾主生殖"等中医"
对PM2.5浓度造成影响的因素有很多,导致PM2.5浓度的表现形式复杂而多变。如何对PM2.5浓度及其相关影响因素进行分析,找到内部存在的规律,进而实现对PM2.5浓度进行预测,对于改善居民空气质量、促进人民健康发展都具有及其重要的意义。通过以北京市污染物浓度、气象数据作为研究对象,提出一种基于相关性递归SVM的PM2.5浓度预测神经网络模型,该方法充分考虑空气质量演变特征的动态关联关系,从而提高
本文提出了多方参与概率隐形传送任意未知多粒子态的方案.首先,利用一个三粒子非最大纠缠Greenberger-Horne-Zeilinger(GHZ)态和一个二粒子非最大纠缠态作为量子通道,提出了三方参与概率隐形传送任意未知二粒子态的方案。然后,利用一个三粒子非最大纠缠GHZ态和两个二粒子非最大纠缠态作为量子通道,提出了三方参与概率隐形传送任意未知三粒子态的方案,最后,将这两个方案进行推广,首先推广
本文提出了以非对称多体态作为量子通道密集编码方案,所谓非对称量子通道就是接收者和发送者所拥有的粒子处于非对称的希尔伯特空间。首先提出了非对称多体量子通道为最大纠缠态时的密集编码方案,并且比较了非对称量子通道与对称量子通道所传的信息量;然后又提出了非对称多体量子通道为非最大纠缠态时的几率性密集编码方案,还讨论了平均信息量与组成量子通道的非最大纠缠态系数之间的关系。
在线社交网络的发展使得信息的传播速度更快、范围更广,因此研究信息传播机制变得十分重要。由于传统的SIR模型具有如下局限性:易感染节点被信息影响的概率是一定的,无法根据节点自身环境做出变化;整个信息传播过程过于理想化,网络中的节点可以实时接收信息。基于上述传统模型的局限性,本文提出了新型的信息传播模型并研究了信息间的关系对于信息传播过程的影响。本文主要工作如下:首先,基于热传递思想提出了一种HT(H
数学作为初中阶段的一门基础学科,受到教师和学生的广泛关注。在新课程改革背景下,培养学生的学科核心素养是重要的教学内容之一。而单元整体教学对培养学生的思维能力及学科核心素养十分有利。单元整体教学是指以多课时单元为基本单位,对单元中的所有知识进行概括和总结,找出重难点进行教学。在初中数学教学中,单元整体教学常用于复习阶段,并取得了非常好的效果。基于此,教师应加强对单元整体教学在初中数学课堂中的运用探究
传统搜索引擎在查询网络数据时,返回的往往都是包含许多噪声的数据,查询效率低下。随着人工智能技术的发展,自动问答系统逐渐成为新的人机交互方式。知识图谱的出现为自动问答系统提供了更加精准的答案来源,基于知识图谱的问答系统也成为一个研究热点。然而,由于中文文本的表现形式复杂多样,传统的知识问答方法很难运用到大规模的中文知识库问答系统中。为提高中文知识问答系统的准确率,本文以开放域中文知识图谱为知识来源,
网络异常流量检测是保证网络信息安全的重要手段,准确、快速的检测出具体的异常流量类型对于维护网络安全至关重要。支持向量机(SVM)已经成为异常检测中一种常用的工具。然而,SVM多用于解决两类分类问题,无法识别异常流量的具体攻击类型,如何有效地将其推广到多类分类,并利用SVM实现异常流量的检测是一个重要研究问题。因此,针对上述问题,本文的主要研究工作如下。首先,本文具体分析了网络流量产生过程及其采集方