基于姿态描述的人体交互动作检测和识别研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:pptcwu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体设备的广泛使用以及视频和图像应用开发的普及,视频和图像数据呈现了爆炸式增长,数据的有效存储和从这些数据中自动挖掘出有用的信息帮助我们更好地生活变得尤为重要。作为这些数据的中心内容——人体活动的分析研究自然是成为了重中之重。   本文主要针对人体交互动作的检测和识别进行研究。区别于大多数单人动作,交互动作的研究在监控安全等应用领域有更大的研究意义,并且从技术难度上给任务带来更大的挑战。本文将从两个角度来验证姿态信息对动作,尤其是交互动作识别起到了至关重要的作用。   第一,基于姿态估计的人体交互动作识别任务。近些年,应用在人体动作识别领域的基于时空兴趣点和词袋模型的空间结构的学习方法层出不穷,这类方法由于局部特征本身的稠密性,其统计的空间结构并不具有语义信息,因此在判别力上大打折扣。鉴于人体姿态估计技术的日益成熟,本文将人体交互动作识别任务建模在其之上,利用定位得到的关节点信息,提取有效的姿态信息用于动作识别任务。考虑到本文研究目标是交互动作,我们提取了交互姿态信息。实验结果表明交互姿态信息对于分类交互动作具有更强的判别力。同时,效仿人类视觉信息处理机制,本文将姿态特征和表征特征进行融合,在UT-Interaction数据集上的实验结果验证了这两种特征的互补关系并极大地提高了识别精度。实验中本文算法对比了当前最好的词袋方法以及基于底层特征的空间关系特征的方法,验证了本文方法的有效性。   第二,基于排序建模的人体交互动作检测任务。现有的绝大多数识别算法都是基于动作发生的时空范围已知的前提下设计的,但是这种假设在现实系统中往往没有有效的办法得到。尽管已经有少量的学者已经开始注意这个问题,并且采用基于局部兴趣点的时空搜索的办法来确定动作的时空位置,但是该问题仍未得到很好的解决。本文提出了一种新的交互动作的检测算法,该算法基于姿态随时间变化的判别力分布先验设计,通过学习型排序算法实现了这种分布先验的建模,并且提出了基于该先验的检测动作序列的起始和终止的有效的检测算法,结合之前提出的识别框架,对检测到的片段进行了类别分类。本文同样在UT-Interaction数据集上对该检测算法做了验证,结果显示了该算法的有效性。  
其他文献
该文提出了一种三层的客户/服务器体系结构--分布Web数据库体系结构DWDA.该结构 是一个开放的、具有联机事务处理功能的体系结构.它的前端即用户界面层采用B/S结构, 并用用AS
连续时间马尔科夫链(CTMC)在网络性能分析、模型检测和系统生物学等领域受到了广泛的关注。本文关注以连续时间马尔科夫链为模型、以条件连续随机逻辑(CCSL)为性质描述语言的
随着汽车工业的快速发展,以车辆作为网络节点的城市车辆网络(VANET)越来越受到学术界和工业界的青睐,如美国的ITS[1]、欧洲的CAR2CAR[2]和SVC[3]等。城市车辆网络作为移动自组织
重复序列在基因组中普遍存在,大量实验证实其在生物进化、遗传调控和基因表达等方面起着重要作用。目前,重复序列的发现与识别技术已经成为基因组学的研究热点。成簇的规律间隔
三角网格模型是表示三维模型的常用手段。随着计算机扫描技术和遥感技术的不断发展,三角网格模型的规模和分辨率不断提升,导致表示三角网格模型的文件的规模不断增加,给模型的存
随着我国汽车数量的不断增多,传统的人力管理由于效率低下,已经无法满足高密度的现代交通需求。以车辆车牌识别为主要手段的视频道路监控技术,是现代智能交通系统(Intelligent T
在日常生活中,记录生活日志是很有意义的。首先,记录生活日志有助于个人进行时间管理。其次,记录生活日志可以帮助其他人更好的了解自己。另外,通过记录个人的生活日志,也为分析个
本文针对长途客车运行中存在的“三超”(超述,超载,司机超时疲劳驾驶)和“三私”(私自组客,私收票款,私拉乱运)等问题,通过建立车载视频监控系统,完成对长途客车的实时监控和管理,而在车
为加深人类对日地空间的深入了解,各国研发出大量空间环境模型对空间环境进行仿真模拟和预警预报。在此基础上,逐步建立了集成多空间环境模型并对模型计算结果进行可视化展现的
数据可视化技术能够将各种繁杂的数据转换成直观的图形和图像,从而显示数据之间的相互关系,揭示隐藏在大量数据背后的规律,为科学研究提供辅助分析手段。随着计算机性能的飞速发