论文部分内容阅读
视频一直是人们进行信息交流的重要载体。计算机软硬件技术的快速发展和数码设备的广泛普及使各式各样的视频数据在近几年内呈现出了爆炸式的增长趋势,如何快速地获取视频信息、与其进行高效交互进而有效利用这些视频信息具有巨大的应用价值。伴随着这些视频资源数量的急剧增加,用户基于内容的视频数据访问应用越来越广泛,对视频信息的呈现、编辑、浏览和检索等需求也越来越突出。然而,与这些视频数据如此巨大增幅相对应的则是人与这些信息之间的交互方式并没有随之发生根本性的转变,现有的视频数据分析与交互方法已严重制约着它的进一步发展。随着这些数据超出人脑高效处理信息的能力范围,如何帮助用户对视频信息的需求进行有效认知,支持用户对庞大的信息数据库进行快速浏览、分析、理解与高效交互已经成为了现阶段视频应用研究领域亟需解决的问题。因此,探索影响视频应用进一步发展的交互瓶颈,围绕视频内容的表示方法和增强用户在可视编辑过程中的交互式参与体验等技术进行相关研究具有重要的意义。 本文工作针对现有的视频媒体信息的结构化、视频内容分析等技术,总结视频内容的呈现、组织管理、交互以及基于内容的视频摘要相关的理论、系统的发展状况,以用户为中心,研究融合认知的高效的视频内容的表示方法、视频信息生成与优化方法以及用户与视频媒体数据进行高效交互的技术,以一种多尺度的视频媒体表示和浏览方法,在基于感知的语义框架和交互计算基础上对关键视频对象进行提取从而实现融合认知的多尺度视频信息数据可视化。本文对视频数据多尺度的定义以及表示方式、交互方法展开研究,主要成果包括以下三个方面: (1)基于视频信息的用户认知模型:基于认知计算模型,分析了用户在浏览视频内容时的认知过程,根据该认知过程中用户对不同视频层次数据的理解,提出面向视频内容结构的用户认知模型,并根据用户在不同认知阶段所获取的不同的视频内容结构,给出面向视频内容的上下文无关文法及其推导逻辑分析和形式化描述。 (2)视频数据的多尺度组织与呈现方法:考虑到用户在浏览和理解视频的过程中,首先通常希望在粗尺度上对视频进行总览,然后根据自己的喜好或目的对特定的内容进行更精细尺度上的浏览。所以本文基于视频内容的用户认知模型对视频内容结构进行划分,提取和表达不同尺度、不同层次上的视频信息,并将这些信息从不同层次,不同角度进行有效组织与呈现。 (3)基于草图的视频信息交互技术:分析了草图的自身特性及其描述能力,在传统的信息数据可视化交互技术的基础上针对视频内容的特点融入草图交互技术,让用户以自然高效的草图交互方式与视频内容进行交互。 (4)设计实现原型系统,并对其进行用户评估:在上述研究基础上,设计并开发了融合认知计算的多尺度视频内容交互可视分析原型系统:面向电影视频的地图隐喻的多尺度分析系统;面向监控视频内容的多尺度分析系统,最后通过用户评估实验,实验结果证明了该方法具有的易用性,取得了良好的效果。