视频中人体行为识别若干问题研究

被引量 : 17次 | 上传用户:hhy0412
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行为识别是计算机视觉、机器学习、人工智能等领域的热点与重点研究方向。该方向对图像、视频数据中的人体行为进行分析识别,其研究成果在安全监控、病残监护、多媒体内容理解、人机交互、虚拟现实等方面得到了切实应用。然而,现有的行为识别技术在实际应用中存在很多局限性。为满足实际需求,本文针对如下四个关于视频中人体行为识别问题展开研究。1)在特定场景下,某些行为的样本极难收集,如何利用极少的样本快速的对特定行为进行识别;2)在行人可检测的较复杂场景中,如何有效的对特定行为进行识别;3)在行人可检测的较复杂场景中,如何快速有效的对多类行为进行识别;4)在行人不可有效检测的复杂场景中,如何有效的对多类行为进行识别。本文从实际应用问题出发,以模式识别、机器学习等理论为基础,开展了一系列创新性的研究,并提出了如上四个问题的解决方法。本文主要的研究工作和贡献如下:1)提出了一种基于霍夫投票的全局行为表征方法,即位移直方图序列表示法。该方法首先对行为视频中的运动区域进行粗略估计;然后根据运动区域中连续多帧图像中的兴趣点的匹配情况,使用二维的位移直方图表征这些连续图像中人体的运动信息;最后根据位移直方图序列,采用矩阵余弦相似度的度量方式对行为进行识别;对于识别的行为,匹配的兴趣点精确地定位了行为发生的时空位置。实验结果表明,在静态或背景较均匀场景下,该方法能够有效的对特定行为进行检测识别。此外,该方法采用从粗到细的行为定位方式,有效的提高了行为的表征速度。该方法解决了在样本极少情况下,特定行为的识别与检测问题。2)提出了一种在新视角下对人体行为进行时空特征学习的方法。该方法首先对行为人体进行检测与跟踪,并使用多限制玻尔兹曼机(RBM)对人体各部位的时序形状特征进行时空特征编码;然后将人体各部位的时空特征编码通过RBM神经网络整合为行为视频的全局时空特征表征;最后通过训练的支持向量机分类器对行为进行识别。大量实验验证了该方法的有效性。这种从人体各部位的形状特征序列中提取时空特征的方法,开辟了行为特征提取的新视角。该方法解决了较复杂场景下,特定行为的识别问题。3)提出了一种基于倒排索引的快速的多类行为识别算法。该方法首先对检测与跟踪到的行为人体的兴趣区域,提取形状运动特征,并通过层级聚类的方法利用这些特征构建行为状态二叉树;基于状态二叉树,快速的将行为表征为行为状态序列;然后,通过构建的行为状态倒排索引表与行为状态转换倒排索引表,计算行为状态序列对应于各行为类别的两个分值向量;最后根据加权的分值向量来识别行为。实验表明,该方法能够快速的对多类行为进行识别。行为状态二叉树的应用,加快了对行为视频的行为状态序列表征;倒排索引表的使用,明显提高了多类行为的识别速度。该方法解决了较复杂场景下,多类行为的快速识别问题。4)提出了一种基于独立子空间分析网络,利用从视频中学习的空间特征对视频行为进行时空特征编码的方法。首先,该方法利用引入规则化约束的独立子空间分析网络,学习了一组时间缓慢不变的空间特征;对从采样的视频块中提取的此类特征在时间域与空间域上进行池化处理,得到了能够有效的识别行为的局部时空特征。然后,基于特征袋(BOF)模型使用提取的局部时空特征对行为进行表征。最后采用非线性的支持向量机分类器识别多类行为。实验结果表明,时间缓慢不变规则化约束与去噪准则的引入,使学习的空间特征及提取的局部时空特征对混乱背景,遮挡等因素具有较强的鲁棒性。该方法解决了复杂场景下,多类行为的识别问题。
其他文献
韩国临时政府是在1919年韩国“三一”运动的基础上在我国上海建立的流亡政府。自1919年建立到1945年解散,在中国经历了27年时间。在此期间,它以中国为舞台,为推翻日本对韩国的殖
本文先简要介绍了英语浯法教学,再从现代语言学、心理学等理论角度出发对“对比分析法”做了一定阐述,然后从我国中学英语教学的实际出发,指出“对比分析”是比较切实有效的教学
<正> 赵紫阳同志在党的十三大报告中多次提到“效率”问题。在谈到政治体制改革时,他指出:“改革的长远目标,是建立高度民主、法制完备、富有效率、充满活力的社会主义政治体
随着建材和家具市场的发展和开拓,人们的舒适需求度和审美鉴别度都有很大的提高,人们在选购家具的过程中,为了融入大环境中能够达到协调统一的搭配效果,对于家具上原本备受忽
一般来说,城市化是工业化的产物,那么后工业化时期还有城市化过程吗?城市的起源可追溯至10000多年前的旧石器时代,此后几千年中人类经历了从原城市化到第一次世界性城市化的漫长
在军事工程上研究弹丸对岩石或混凝土等介质的侵彻问题,具有十分重要的理论和现实意义.本文详细介绍了经验法、近似解析法和数值分析法三种方法研究侵彻问题的进展情况,并对
为适应社会对复合型人才的需求,我校在非管理类专业中开设企业管理课程,受学生学习态度、课程本身等方面因素的影响,企业管理课程实际教学效果与预期存在较大差距。因此,必须
随着计算机技术的高速发展,计算机技术的应用越来越广泛,计算机渐渐成为人们生产活动中不可缺少的一部分。计算机实训机房是中职院校学生接受计算机实训课程教育的场所,也是
目的:观察六味地黄丸含药血清及其主要单体梓醇对肾小管上皮细胞株HK-2转化生长因子-β1(transforming growth factor-β1,TGF-β1)/Smad信号通路的影响。方法:制备大鼠六味
文化传播如水银漫地、无孔不入,并不断地通过大众传媒从形式到内容逐渐渗透、改变着民族文化主体并建构一种新的社会文化结构、文化风格和文化模式。越来越多的少数民族节日