动态场景语义理解和分析

来源 :中国科学院自动化研究所 | 被引量 : 0次 | 上传用户:icefireren
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
动态场景语义理解和分析的研究目标是让计算机视觉系统具有和人类类似的视觉感知能力,能够对动态场景进行感知、分析和理解,能够得出人类习惯的语义描述。作为计算机视觉研究的最高目标,随着相关研究的进展和技术的完善,动态场景的语义理解越来越被国际学术研究团体所重视。有益的研究成果不断涌现,其中一些成果已经成功并广泛地应用到了人们的日常生产、生活中,发挥了重要的作用。巨大的实际需求和一定程度上的成功应用极大鼓舞了计算机视觉学术和产业界,使得该领域的研究和产业化成为近些年来的热点。   要实现对动态场景进行语义分析和理解的任务,大致包括以下几个步骤:首先对动态场景中的视觉可感知的实体进行提取和初步分类,进而对提取出来的有效特征进行语义化标注和结构化表达,之后对时序变化的结构化数据进行分析,以及进一步的事件和行为的建模分析,从而实现对动态场景的语义理解和分析。近年来,在计算机视觉研究中,高层语义理解和事件与行为分析方面的工作虽然受到了越来越多的关注,但是在这个领域中还存在着很多重要的理论与技术问题需要解决。   本文作者提出了一个比较完整的动态场景语义理解和分析的框架结构,实现了从场景中的底层视觉可感知数据到高层语义分析和理解的功能。整个框架涉及到许多图像处理、计算机视觉和人工智能的基本问题,包括视觉可感知实体的提取、场景的语义化建模、目标的检测和跟踪、目标的分类和识别、信息的结构化表达、时空数据分析、行为和事件的分析及语义理解等等。本文中的主要工作和贡献包括:   ①提出了一种基于颜色空间聚类的背景建模和运动目标检测的方法。这种方法将象素在时序上构成的点过程的各通道颜色分量在颜色空间进行聚类,各聚类中心构成的图像就是背景,偏离各聚类中心的象素构成的连通区域就是运动目标。   ②提出了一种融合不同图像特征进行静态图像分割的方法。这种方法将颜色以及多种纹理特征共同构成数据向量,运用非监督的聚类方法对数据向量进行聚类,聚类的中心就是图像不同象素或区域所属的类别,根据这些类别完成对原始图像的分割。实验证明了该方法良好的图像分割效果。   ③提出了一种基于高斯分布的目标基本运动和交互模式提取与分类的方法。这种方法利用观测间隔内目标的基本运动相关数据从统计上基本满足高斯分布的现象,依据验证数据偏离高斯分布中心的情况完成简单的运动和交互模式的提取和分类,并得到了比较好的实验结果。   ④提出了一种基于半监督学习的用于结构化数据语义标注的方法。这种方法对数据集中的少量数据进行语义化标注,然后采用半监督学习的方法完成对数据集中其它数据的语义标注。   ⑤提出了一种基于层次化本体的语义信息结构化表达方法。这种方法能够有效表达相关的概念化数据,将相关数据整合到一个层次化的可计算结构模型当中,对知识工程、数据挖掘和理解等相关领域有一定的借鉴意义。   ⑥提出了一种基于变分贝叶斯隐马尔可夫模型的时空数据分析方法。这种方法利用变分贝叶斯隐马尔可夫模型来挖掘并发现隐含在状态跳转序列中的规律性和有关约束,部分尝试并解决了智能视觉监控系统中从数据到知识化的规律方面的问题。   ⑦提出了一种语义相似性度量方法和基于语义流形的事件分析方法。这种方法利用定义在树状结构上的概念之间相似性度量方法,对概念化数据向量进行流形计算和分析,得到了直观而有意义的结果。   ⑧发展了一种由底层数据驱动的基于层次化本体数据表达和概率图模型统计分析的动态场景语义理解和分析的框架,为传统计算机视觉和高层语义理解与推理之间架起了一座桥梁。   总的说来,本文围绕一类特定动态场景(监控场景)深入并系统地研究了底层视觉可感知数据提取、信息结构化表达、时序数据分析,以及最终的高层语义分析和理解等问题,构建了一个完整有效的动态场景语义理解和分析的理论体系框架。本文中的一些有益的成果将对数据挖掘、人工智能等相关领域的研究有一定的借鉴意义。
其他文献
随着计算机总线技术的发展,数据采集系统可以方便灵活地将采样数据传输到PC机上,利用CPU强大的运算能力来进行分析与处理,这大大降低了采集系统对高速数据处理的难题,在数据采集
随着计算机和自动化技术的普及和进一步发展,中国的各个领域都在进行信息化建设。在国内工矿企业领域,铁路站运输信号开放仍然处于人工开放,给铁路运输系统的自动化带来了障碍。
当室外温度变化时,一个供热系统需要根据室外温度的变化规律,对采暖用户的运行参数(供水温度)进行实时调整,持续保持供热量与建筑物的耗热量相一致,达到室内温度在不同室外温度情况
滚转弹以其能克服气动外形的不对称和发动机推力偏心等干扰因素的影响,在国内外弹箭上取得了广泛应用。传统无控滚转弹落点散布较大,精度不高,因此需要良好的控制器实时修正弹道
气固两相流的流动参数主要包括固体颗粒的流速、浓度、质量流量等,其中相浓度是反映气固两相流流动状况的一个重要参数,通过对输送管道内固相浓度进行在线检测,以达到生产计量或
图像分割是图像处理领域非常重要的课题.在图像分割领域,遗传算法常用来帮助确定分割阈值,遗传算法作为一种优异的全局搜索的优化方法得到了广泛应用.然而在实际应用中也存在
当前信息技术的进步,带动了我国IC产业的快速发展。随之带来了贴片机,上芯机等精密电子封装设备需求的快速增长。这些设备有着相同的技术特点,结合视觉的检测技术以及运动机
随着科技的不断进步,我们身边越来越多的领域都在进行着数字化及网络化革命。在监控领域,集成了数字图像处理、远程网络传输等最新技术的网络视频监控系统,正在逐步取代传统
学位
随着汽车产品的不断发展,汽车空调的性能受到人们越来越多的关注。传统汽车空调系统的驱动源是汽车发动机。由于发动机转速视车辆行驶速度而定,因此无法根据空调系统的需要对其
自动测试系统是计算机技术和仪器技术相结合的产物,虚拟仪器理论的提出将自动测试系统带入了虚拟化时代.随着软件开发技术的进步.将面向对象软件开发技术用于自动测试系统软