视频人脸及人体行为识别关键技术研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:momoww
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在计算机视觉与模式识别领域,视频人脸识别与视频人体行为识别问题始终是研究热点和难点问题。本文详细阐述了视频人脸识别及视频人体行为研究的工作进展,并基于目前的研究方法提出了若干视频人脸识别与行为识别算法,主要工作如下:1.无约束视频场景复杂多变、数据量大、设备不一致且环境不可控,使得视频中充斥着大量的遮挡和人脸旋转,导致人脸识别的准确率不高,性能不稳定且计算量较大。为解决上述问题,本文提出了一种基于QPSO优化的黎曼流形人脸识别算法。该算法将视频人脸识别视为图像集相似度度量问题,图像对齐后提取纹理特征并进行融合处理,再利用带有QPSO优化的黎曼流形大幅度简约维度以获得视频人脸的内在表示,相似度的度量则采用凸包距离标定方法,最后利用SVM获得最佳分类识别结果。通过在Youtube Face数据库上与当前几种主流算法进行的对比实验,验证了本文算法的有效性,所提算法识别精度较高,误差较低,并且具有较强的鲁棒性。2.针对传统基于特征提取的人体行为识别方法预处理操作复杂,导致人体行为脸识别的准确率不高的问题。本文提出一种基于多核3D-CNN的视频人体行为识别算法,该算法分别提取图像序列的灰度特征、梯度特征以及光流特征,同时,对三类特征序列采用不同的卷积核进行卷积操作以获得图像序列的多角度特征,构建3D-CNN网络后进行视频人体行为识别。通过在KTH数据库上与当前几种主流算法进行的对比实验,验证了本文算法的有效性。3.如何利用视频中的时空连续性信息设计有效的视频纹理描述算子是实现视频人脸识别及视频分析与理解的重要途径。本文提出了一种基于局部时空连续性聚合描述的视频人脸识别算法。该算法用图像集合表示视频,对图像集合划分分块,通过LBP-TOP算子提取视频的局部时空纹理特征,利用k-means算法获取该视频描述集合的聚类中心,基于这些聚类中心对视频描述集合进行聚合得到一个单独的向量,以得到更为细致的刻画视频的局部信息。特征向量之间的相似性是通过欧式距离来定义,并对不同分量赋予相应权重。最后利用最近邻方法获得最佳分类识别结果。通过在Honda/UCSD数据库上与当前几种主流视频描述算子进行的对比实验,证明所提出的视频描述子具有较强的可辨别能力。关研究的基础的上,提出了若干视频人脸识别算法与人体行为识别算法,并对目前该领域仍然存在的问题进行了总结,对今后视频分析与处理等领域的发展进行了展望。
其他文献
60年来,小学科学课程性质从"主要学科"、"重要基础学科",到"科学启蒙课程";课程目标从知识教育为主、全面发展到科学素养养成的发展历程;课程内容主要包括生命世界、物质世界
当今社会科技发展日新月异,人机交互方式也经历了数次更迭。现在,大范围使用的图形界面与触摸交互方式并不是最适合人类交互习惯的方式,因此,基于计算机视觉的人机交互方式正
随着我国经济的日益增长,人们生活节奏的加快,汽车的数量也变得越来越多,随之人们对交通控制以及安全管理的要求也日益提高。现在,交通管理正朝着智能交通系统的方向发展,车
目的阐述线粒体ATP合酶中寡霉素敏感相关蛋白(OSCP)的位置、结构、功能及其在药理学中作为分子靶点的研究。方法根据近年文献资料对寡霉素敏感相关蛋白的位置、结构、功能及
<正> 蝇蛆具有生活周期短、繁殖能力强、食性广、适应性强以及易于人工控制、适于工厂化生产等特点,其营养价值丰富,开发利用价值深远,发展蝇蛆养殖业是一条致富的好门路(本
利率的市场化会对整个社会经济产生重大影响,尤其是以存贷款为主要业务的商业银行。面临冲击和负面影响较大的应当是资金总量处于中小水平的中小银行,这是因为他们规模相对较
2011-2012年于贵州省油菜主产区设置直播油菜氮磷钾硼肥田间试验,以推广品种油研599为材料,研究施肥对产量、养分累积量、肥料利用率及经济效益的影响,了解当地(典型的南方水
目的 探讨3种常用他汀药物(普伐他汀、辛伐他汀和氟伐他汀)介导纤溶酶原激活物及其抑制剂对体外培养人血管平滑肌细胞(VSMC)增殖和迁移的影响。方法 采用四唑盐(MTT)比色法测
本文介绍福建厦漳跨海大桥V标疏港公路桥现浇箱梁预应力张拉的施工工艺、技术和经验。