【摘 要】
:
本文针对计算机视觉中的一项重要课题,即视频中的特征提取和描述问题展开了研究。为了充分发掘和利用视频中的表观和运动变化信息,本文利用几何代数这一简便高效的数学工具,对视频图像的特征提取和描述算法展开了深入研究。其主要研究内容包括:1)提出了一种基于视频表观与运动信息的UMAMV-SURF(Speeded-up robust features based on a unified model of a
论文部分内容阅读
本文针对计算机视觉中的一项重要课题,即视频中的特征提取和描述问题展开了研究。为了充分发掘和利用视频中的表观和运动变化信息,本文利用几何代数这一简便高效的数学工具,对视频图像的特征提取和描述算法展开了深入研究。其主要研究内容包括:1)提出了一种基于视频表观与运动信息的UMAMV-SURF(Speeded-up robust features based on a unified model of appearance and motion-variation)特征提取算法。本文首先以几何代数为数学框架,在几何代数视频表观与运动信息统一模型(unified model of appearance and motion-variation,UMAMV)的基础上,首先计算了视频图像UMAMV模型上的积分视频,然后构建UMAMV模型下积分视频中的Hessian矩阵来求取局部极大值。为简化构建Hessian矩阵中高斯二阶微分与积分视频的卷积运算,本文针对UMAMV模型设计了一种三维盒子滤波器。通过盒子滤波器和积分视频将高斯二阶微分与视频的卷积运算简化为简单的加减运算,降低了算法的计算复杂度,并且通过改变盒子滤波器的大小构建视频UMAMV模型上的尺度空间,以保证特征点的尺度不变性。最后用3D非极大值抑制的方法来提取UMAMV-SURF特征点。实验结果表明本文算法提取出的特征点不仅能够反映视频空域上的局部信息还能很好的反映时域上的运动信息。2)提出了一种基于视频表观与运动信息的UMAMV-SURF特征描述算法。首先在UMAMV模型上对特征点邻域分别在空域和时域方向上计算Haar小波响应值,然后计算得出特征点在UMAMV模型上的主方向,并根据特征点的主方向对特征点坐标和响应值进行旋转以保证特征点的方向不变性。最后通过统计Haar小波在视频UMAMV模型上的响应值以及归一化得到特征点的描述矢量。实验结果表明本文所提出的UMAMV-SURF特征描述算法不仅减少了算法的计算时间,还提升了视频行为识别的准确率。3)提出一种基于视频表观与运动信息的视频UMAMV-TSI3D(A new Two Stream Inflated 3D ConvNet based on a Unified Model of Appearance and Motion-Variation information)网络。首先将UMAMV模型中的运动信息分解成x和y两个方向上的运动分量并组成两个独立的图片通道。然后将UMAMV模型中表观信息和分解后的运动信息结合I3D(Inflated 3D ConvNet)网络组成UMAMV-TSI3D网络中的表观信息I3D网络和运动信息I3D网络。两个网络训练各自的网络模型并分别得出其各自的预测结果,对上述预测结果进行融合以获得最后的结果。实验结果表明在网络中加入视频中的运动信息能有效的提高算法的识别准确率。
其他文献
目的应用光学相干断层扫描血管成像(optical coherence tomography angiography,OCTA)技术定性定量分析原发性开角型青光眼(primary openangle glaucoma,POAG)黄斑区及视盘旁的微循环变化特点,探讨各期开角型青光眼患者黄斑区与视盘旁的微循环变化与视网膜结构损伤与视野损害的关系。方法选取观察对象为2018-04至2019-04就诊于深圳
19世纪末20世纪初,西方国家出台各种社会保障政策,以应对工业化的加速发展带来的贫困、疾病和失业等一系列问题,为社会成员提供福利。随着政府社会保障范围不断扩大,公共福利开支也大幅上升。面对政府在社会服务方面开支日益庞大而服务效率日益低下的境况,西方国家纷纷大规模削减福利开支,把市场与非营利组织引入福利供给,政府购买公共服务的模式应运而生,而后逐渐推广至全球。随着我国经济和社会持续快速发展,公共产品
随着科学技术的快速发展,彩色图像的处理越来越热门,很多专家学者都对该领域做了深入的研究。图像的风格迁移在日常生活中的应用越来越多,对于人们的照片的处理也显得格外有趣。传统的图像风格迁移需要花费更多的时间和精力,也需要用户有更高的软件处理技巧。随着深度学习的不断发展,深度学习也被广泛应用于图像的风格迁移。这使得图像的风格迁移更加容易实现,不再是少数一部分人掌握的技巧。图像颜色迁移技术是风格迁移的一个
三维人脸重建是计算机视觉的热门研究方向,一般可以通过深度摄像机实现重建。但是,深度摄像机成本高,如果能单目二维相机在无约束条件下,进行人脸重建,那么将降低成本,极大地推进人脸识别技术的应用,具有重要实际意义。然而,单目三维人脸重建存在如下问题,即三维人脸估计不稳定,导致同一个体的三维模型差异化较大,或者过于泛化。近年来,基于卷积神经网络实现的重建算法得到了重大发展,但是,通常需要消耗大量的运算资源
随着住房制度的改革、市场经济的快速发展以及社区共同治理理念的推广,诞生了物业管理这一新型现代服务行业和业主委员会这一社区基层自治型组织,进而形成了以业主、业主委员会、物业服务公司、社区居委会为四大主体的社区自治结构。然而,社区自治模式的不完善、业主委员会组织制度的不健全以及物业管理行业的发展不均衡,使得社区共同治理运行并不顺利,社区物业管理矛盾日益凸显,尤其体现在多方主体间的关系互动和协作方面,主
随着科学技术的不断革新,在新媒体环境下,如何更好的利用新媒体的优势弘扬和推广民俗文化,是值得深究和探讨的现实问题。本文以山东杨家埠木板年画推广现状为研究主体,将其置身于新媒体环境中进行推广手段创新的探索。杨家埠木板年画流传至今已有六百余年的历史,它的数百年传承,以图像的形式丰富了区域的文化积淀,在以今天山东潍坊寒亭为中心的相当广阔的区域内,形成了自己的文化影响,对于区域文化性格的塑造,文化精神的涵
从设计学的角度来看,隶书作为字体演变过程中重要的阶段,不仅是传统书法领域的基础视觉符号,也是当今字体设计的美学代表。从隶变的时间节点来看,承载隶书的书写媒介在很大程度上是以简牍为主,虽简牍的书写形式在现代已不再盛行,但随其相辅而行的隶变形态及其审美特征已然成为了后世书法艺术的基本规范,对现代平面设计以及书法艺术产生了新异的影响因素,其美学特征以及丰富的形态特征为现代设计师提供了一种全新的美学营养。
公安机关作为国家公权部门,肩负着保障人民安居乐业的重要使命,但其在行使公共权力的同时也伴随着风险和腐败的产生,人民需要委托一个部门对公安机关行使公权力进行监督,公安审计正是在这样的背景下产生的。公安审计与政府审计的执行主体不同,政府审计是由国家审计机关行使监督权,而公安审计由于其特殊性和保密性,无法借助外部监督,因此公安审计是由公安机关内部审计部门行使监督权力,是内部审计的重要组成部分。公安机关经
阿尔茨海默病(Alzheimer’s disease,AD)是一种老年神经系统退行性疾病,随着社会老龄化,AD已成为世界性研究热点和难点。β淀粉样前体蛋白(β-amyloid precursor protein,APP)基因是最早发现与AD有关的突变基因,APP(表观)调控异常导致一系列病理变化,APP基因过表达促使神经细胞进入细胞周期而致其凋亡,从而引起AD的发生与发展,而脱氧核糖核酸(deox
视觉跟踪是机器视觉研究的主要方向之一,因其广泛的应用需求和实际意义,成为机器视觉领域的研究热点。其中,基于相关滤波的视觉跟踪算法兼顾速度和精度的优势,吸引了大量学者的关注,并且取得了较为显著的效果。但是,在实际的环境中,由于遮挡、目标形变和尺度变化等影响,往往导致目标跟踪失败。随着RGB-D(颜色深度图)相机的普及,深度图能够反映空间信息,从而为遮挡检测和目标恢复提供了有效的空间依据。因此,基于R