【摘 要】
:
随着视频采集、存储设备的广泛使用和网络传输性能的不断改善,国家重点支持的数字视频产业在电视、网络、手机等载体上发展迅速。面对如此繁多庞大的视频,人们期盼着出现一种
论文部分内容阅读
随着视频采集、存储设备的广泛使用和网络传输性能的不断改善,国家重点支持的数字视频产业在电视、网络、手机等载体上发展迅速。面对如此繁多庞大的视频,人们期盼着出现一种快速有效的选择方法以节省时间和精力。视频摘要技术产生的视频摘要作为一种反映视频主要内容的精简版本,可以解决感兴趣视频“选择难”的问题。本文主要研究从底层特征、人物对象到说话事件的静态视频摘要生成方法,其核心技术是“代表帧”的提取,主要做了以下工作:(1)从视频帧底层颜色特征出发,改进了传统的颜色聚合向量使用固定连通阈值不能准确描述视频帧特征和基于等价关系聚类中截矩阵的固定阈值不能适应视频内容丰富变化的不足,并加入了视频的时序特征,生成一般视频摘要。其过程不需人为干预,阈值适应性强,结果也令人满意。(2)引入“人物基础帧”的概念及其提取方法,并在“混合颜色空间”中训练肤色的高斯混合模型,不仅极大地减少了人物对象的检测帧数,而且更加准确地描述了肽色的聚集特性。通过检测人物基础帧上的肤色区域生成的人物视频摘要满足了用户对视频人物的快速了解和认识。(3)结合运动区域与人脸检测,提取说话事件代表帧,生成说话事件摘要。在提取运动区域时,提出了人物基础帧与其运动区域之间对应关系的方案。在使用Haar-like特征和AdaBoost算法训练强分类器检测人脸时,通过缩减较小矩形、改变检测窗口大小来解决特征数量巨大及人脸多尺度问题,并给出特征值的具体计算表达式,弱分类器的分类阈值采用有序分段穷举法,使选择的最优弱分类器更准确。生成的说话事件摘要基本反映了视频人物的动作和行为。
其他文献
随着科技的进步和技术的发展,在临床医学中医学CT图像发挥着越来越重要的作用,它成为医师诊断疾病的重要手段,尤其在肺癌的早期检查中。近年来,医学影像技术的发展提高了医学
自R.Ahlswede等人于2000年提出网络编码的理论以来,网络编码逐渐成为网络信息论的研究热点。目前网络编码的研究开始逐渐向应用领域发展,如无线网络编码、传感器网络、大文件分
多示例分类模型最早是Dietterich等人[1]在研究如何解决制药业中选择哪种分子入药中提出的一种模型。在多示例学习中,我们直接把标签赋给多个示例组成的包,而不是包中的示例。
水平集(Level Set)方法最早由Osher和Sethian提出的,该方法的基本原理是将演化的曲线或者曲面作为零水平集嵌入到高一维的水平集函数中,通过演化高维中的函数,达到演化零水平
MicroRNA(miRNA)是一类长度约为22-24个核苷酸的非编码RNA,能够在转录后层次上调控基因表达。大量研究表明,miRNA与生物体内许多重要的生物过程相关,可以作为疾病临床诊断和
图像工程目前研究和发展的瓶颈主要在理解层次上。本文提出了以像素统计为基础,将图像处理、图像分析、图像理解三个不同的过程融为一体。同时,在保留原有算法优点的基础上,解决
随着电影行业信息化系统的不断完善,制片商和放映公司积累了大量商业电影的观众和票房销售数据,这些海量数据使用传统的查询或分析工具往往不能识别其中有价值的信息。如何更
保障城市排水管网安全运行,必需对排水管网进行全面监测。山地城市地形地貌复杂,地质结构特殊,滑坡、山体崩塌等自然地质灾害时常发生,这些地质灾害可能会引起排水管网破裂、
聚类分析作为重要的数据挖掘技术,已在电信、市场、金融、医学、科研和互联网等诸多领域得到广泛应用。聚类就是根据相似性把对象划分成组的过程。聚类分析的数据可分为数值数
随着现代信息社会的发展,空间数据库、地理信息系统(GIS)、CAD已广泛应用于公共管理,科学研究和商业领域,第二次全国土地调查中就采用了GIS技术。而空间索引技术作为这些应用的