论文部分内容阅读
信息时代以新闻视频为代表的多媒体信息在国家政治、经济、文化、外交、国防安全以及人们日常生活等领域发挥着重要作用。研究如何从大量的新闻视频数据中提取出潜在的、有价值的知识已成为必然。传统的多媒体处理和基于内容的检索技术虽然在多媒体数据组织、管理、浏览和检索等方面取得较好的成效,却无法发现其中潜在的高层语义知识;传统的数据挖掘技术虽然能够解决结构化或半结构化数据的知识发现问题,却难以直接应用于非结构化的多媒体数据。本文的研究旨在结合基于内容的视频处理技术和传统的数据挖掘技术来解决多模态、高特征维的新闻视频中潜在的、有价值的、可理解的模式知识的发现问题。本文首先提出了一个新闻视频挖掘概念和技术框架,在此基础上重点研究了该框架中新闻视频语义结构挖掘、语义主题挖掘和语义事件挖掘等关键技术。论文的主要工作和创新点体现在以下几个方面:(1)提出了基于内容的新闻视频挖掘的概念和技术框架。在概念框架中,定义了新闻视频挖掘的概念和任务,提出了新闻视频挖掘的层次结构。在技术框架中,提出了新闻视频挖掘的系统结构,介绍了新闻视频挖掘的重要关键技术,同时指出本文研究的主要任务。(2)提出并改进了部分新闻视频语义结构挖掘方法。提出了一种基于图像分割与对象跟踪的新闻视频镜头探测方法和一种基于播音员声纹的音频镜头探测方法。在此基础上,提出了一种综合音视频多线索的新闻故事单元探测方法,为后续的高层挖掘奠定了基础。实验证明,本文提出的方法对视频的低层特征变化、对象运动、摄相机运动和视频质量差异具有较强的鲁棒性,能较好地克服故事单元定位不准和对特殊场景较为敏感等问题,获得较好的查全率和查准率。(3)提出了一种基于多翼Harmoniums模型的新闻视频语义主题挖掘方法。基于双层无向图模型Harmoniums,对新闻视频的伴随文本特征和关键帧的HSV颜色直方图、边界直方图等视觉特征进行高维多模态数据联合建模,生成视频数据的低维潜在语义模型,即多翼Harmoniums新闻视频潜在语义主题模型,对新闻视频语义主题进行挖掘。该模型通过隐含主题与观测输入数据间的双向依存关系扩展和改善了先前的基于两层的随机场模型。实验证明,该模型在促进有效推理、鲁棒主题混合和灵活潜在主题空间建模等方面具有较好的性能。(4)提出并改进了部分新闻视频语义事件挖掘方法。首先,提出了一种基于多语义类新闻视频事件表示法,并给出了新闻视频事件间的相似性度量的计算方法。然后,提出了一种改进的增量k均值的新闻事件探测方法。该方法克服了初始聚类中心选择和对新闻语料处理顺序过分依赖等弊端,明显提高了事件探测性能。最后,提出了一种基于多语义类的新闻事件多维频繁模式挖掘方法和一种基于“事件立方”关联图的可视化方法。该挖掘方法首先建立新闻事件多维事务数据库,然后采用扩展的Apriori性质的剪枝策略和多维索引树对新闻事件多维频繁模式进行挖掘。实验表明该方法是有效且高效的。同时,基于“事件立方”关联图是一种直观且有趣的可视化工具。综上所述,本文的研究主要集中在基于内容的新闻视频语义层次上的挖掘,提出了新闻视频挖掘概念和技术框架,从语义结构、语义主题和语义事件三个层次分别探讨了新闻视频挖掘方法与应用,在理论和应用上都取得了一定的成果。这些研究不仅对视频分析和挖掘技术具有积极的影响,同时也对多媒体情报分析技术具有的理论和实践意义。