【摘 要】
:
视频中的人体动作识别,已经成为计算机视觉和模式识别领域中最具研究价值的课题之一。它在视频监控、视频检索、手势识别、人机交互以及体育赛事分析等领域中都有着广泛的应用
论文部分内容阅读
视频中的人体动作识别,已经成为计算机视觉和模式识别领域中最具研究价值的课题之一。它在视频监控、视频检索、手势识别、人机交互以及体育赛事分析等领域中都有着广泛的应用前景和巨大的市场需求。尽管计算机视觉研究工作者做出了大量的努力,但人体动作识别仍然是一个极具挑战性的课题。这是因为在现实世界中,由于动作执行者的成像尺寸差异、动作执行时人的外观和姿势差异导致动作识别具有一定的复杂性。此外,动作识别还有类内和类间差异、背景物体遮挡、光照变化、阴影和相机移动等多种因素的影响。 本文围绕视频中人体动作识别的关键问题,针对不同的视频源(RGB彩色视频和Depth深度视频),分别提出了新的人体动作识别方法,具体研究内容如下: 第一,提出了一种基于多核学习的特征融合方法进行动作识别。现有的RGB彩色视频中人体动作识别方法将动作表示为时空兴趣点的行为,从视频中检测时空兴趣点并使用基于外观的描述符进行描述。新方法是从多个时间尺度积累的兴趣点云提取整体特征。由于所提出的时空分布兴趣点云Clouds of Points(COP)表示包含了与传统词袋Bag of Words(BOW)表示不同但互补的信息,因此我们制定了一种基于多核学习方法,对不同的特征进行优化并分配不同的权重进行重新组合。使用KTH和WEIZMANN数据集进行的实验表明,我们的方法胜过了大多数现有的方法。 第二,针对传统的RGB彩色视频中三维信息不足的问题,本文提出了一种新的基于深度视频序列的动作识别算法。该算法将深度视频序列中的每个视频帧投影到三个正交笛卡尔平面上。在每个投影视图下,对相邻帧之间运动能量的绝对差进行积累,形成深度运动图,称为深度运动轨迹图像(DMTI)。然后,从深度运动轨迹图中计算出多尺度方向梯度直方图(MsHOG),形成DMTI-MsHOG描述符。此外,我们还应用L2-CRC协作表示分类器和SVM分类器分别进行动作分类。在MSR Action3D数据集和MSRGesture3D数据集上验证了所提出的方法。实验结果表明了该方法的有效性。
其他文献
随着科技的不断进步,计算机已经非常普及,多媒体技术已被广泛应用。安全防护问题越来越受到人们的重视。作为安全监控系统最有效的手段,视频监控在道路、银行和其它公共场所
云计算具有虚拟化、层次化、动态化和大规模性等特点,因而使其平台监控问题面临着巨大的挑战。其中,针对虚拟化节点的资源监控问题更是重中之重。在实际应用中,对虚拟资源的
相比于单通道合成孔径雷达(SAR)系统,多通道系统因增加了接收通道而使回波数据有了冗余,系统自由度增加,能够获取目标丰富的细节信息,更精准地从背景杂波和噪声中区分出目标,
合成孔径雷达(Synthetic Aperture Radar,SAR)通过飞行载体的运动来形成雷达的巨大虚拟天线,是一种新型的微波成像雷达。它具有高分辨率和全天候、全天时、大测绘带的数据获取
高帧高清晰视频图像的发展对视频图像采集的质量和速率都有了很大的需求。而传统的视频图像的采集技术在数据的传输速率、可靠性以及传输距离等方面已经不能满足现今的需求。
当前,由Apache基金会所研发的Hadoop云计算平台,已经迅速成为了大数据处理领域的热门首选。与此同时,个性化互联网及移动互联网技术的发展,迅速催生出大量具有重要价值的小文
随着高速无线互联应用场景的增加,人们对短距离通信技术的传输速率要求越来越高,现有的处于低频段的WiFi技术很难满足千兆传输速率,因此具有高达7GHz免授权频谱的60GHz毫米波
2013年12月4日工业和信息化部正式向三大运营商发放了4G牌照,标志着中国TD-LTE时代的到来。3GPP分别在R9和R10中定义了LTE广播组播标准,这些标准为LTE广播组播业务奠定了基础
智能手机、平板电脑等移动终端已经成为当今人们的生活必备,移动用户数据业务需求快速增大,但移动网络能够使用的带宽资源是有限的。要解决业务增长与资源受限的矛盾,就要不
对变压器故障的发生部位进行统计得出,变压器绕组、铁芯的故障占变压器总故障的首位,对绕组和铁芯进行状态监测与故障诊断,是保证变压器安全运行同时也是保证整个电网安全运行的关键。本文将有限元分析方法与振动信号分析方法结合起来对变压器的运行状态进行分析。首先对电力变压器的结构和振动的传播途径进行了理论分析,分别建立了绕组和铁芯的等效数学模型,着重分析了变压器正常运行时绕组和铁芯的受力情况和绕组匝间短路故障