镜头边界检测中的不连续度设定与阈值判定问题研究

被引量 : 0次 | 上传用户:cjfalx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数字技术在视频中普遍应用,视频可以通过数字摄像机反复拍摄,通过电脑软件轻松剪辑,通过光盘永久存储,通过网络快速传输,通过数字荧幕精彩呈现。数字化使更多更好的视频走进了我们的生活。然而随着视频(特别是互联网视频)数量以爆炸式地增长,再加上视频内容本身的无结构无层次的特性,给视频的分类,索引,归档,搜索工作带来了巨大的压力。另一方面,YouTube等视频网站已经吸引了全世界网民的目光,人们每天将数以万计的视频上传至网站,而其中不少存在色情、血腥的内容,如何将这些视频从上传的海量视频中找出并剔除成了网站工作人员沉重的负担。就此问题,学界提出了基于内容的视频检索的研究课题。该领域借鉴文本内容分析的方法,首先实现视频内容的格式化,进而实现高层语义(内容)的分析和提取,最后根据这些语义完成视频的分类,索引,归档等。本文所研究的内容正是视频内容的格式化的最基础工作——视频镜头边界检测,即将在时间上连续的视频帧序列分解为镜头这一最小的视频结构单元。本文将镜头边界检测问题分为三个独立的子问题——特征选取、不连续度计算和阈值判定,在每个子问题中,分析总结了前人的研究方法和取得的成果,并针对不连续度计算和阈值判定两方面现有方法的一些不足,提出了以下两种方法:1.在MPEG压缩域中,本文选取I帧的DC系数,分块统计直方图,比较得不连续度,与时间因子和运动差异因子所决定的自适应χ2阈值比较判别镜头边界。该方法无需解码视频,实时性高。2.在非压缩域中,设定可变窗,分块比较窗中第一帧和最后一帧的YCbCr直方图得不连续度,并根据其大小,动态调整下一窗口跨度。该方法仅需解码少量的帧,特征选取更丰富,鲁棒性高。本文通过三段具有代表性的视频,分别对比了双因子自适应阈值与固定阈值,整体直方图与不同分块、不同权重直方图的实验结果,证明了本文提出的自适应阈值和分块直方图的优越性。本文提出的两种镜头边界检测算法,经过TRECVid权威数据库测试,在综合性能上优于一些同类算法,达到了预期的研究目标。
其他文献
随着用户需求的增加和通信与网络技术的不断发展,多网融合已经成为未来网络技术的发展趋势,而多网网关是实现网络互连的关键网元。多网网关要实现异构网的互联,必须具备多种
随着电子信息技术的发展,智能化、网络化门禁系统得到越来越多的应用。以射频卡作为识别信息载体的嵌入式系统的应用,能够满足实际使用中对方便、快捷和高效管理的要求。此外,随
本文研究的是“上残肢肌电信号测试与训练系统”中截肢者残端表面肌电信号数据采集系统的硬软件设计,采集后数据的预处理、分析、特征提取,以及基于肌电包络信号特征的模式识
智能服装是电子信息学科、纺织学科及其它相关学科结合与交叉的产物。它是指对环境条件或因素有感知并能做出响应的服装,不仅能够感知人体外部环境或内部状态的变化,而且通过反
各种管理系统的设计中,授权管理是复杂度最高的模块之一。目前大多数信息系统的授权管理方式都是基于RBAC模型,RBAC模型符合现代企业的组织管理方式,是实现企业内部授权管理的一
MPPPM是多脉冲组合调制,是普通单脉冲PPM和BPSK的推广。它允许每个符号间隔有多个脉冲,它应用符号时隙帧中多个脉冲的位置和极性的不同组合传递信息,每个脉冲可以改变时隙位置和
学位
高光谱遥感或成像即在每个像素面积上获取大量窄波段连续光谱的物质辐射亮度。高光谱成像相对于传统的全色或彩色成像的主要优点是测量得到的反射率也就是物质的光谱特征可以
综合脉冲与孔径雷达(SIAR)是一种新体制米波雷达,具有良好的反隐身性能,可以通过把有限数量的阵元分布在一个有足够大半径的圆周上保证所需的角分辨率,而且能同时实现目标的
空间站局域网的交换体系结构对空间站局部网络的性能具有重要影响,一个好的网络交换体系结构可以保障系统正确工作,并且有效降低系统的硬件资源消耗和功耗,提高系统带宽和吞
HINOC (High performance Network Over Coax)技术利用有线电视网已有的同轴电缆线路和分配网络,组建最后100米范围内的宽带接入网,实现高速和高质量多业务接入。不仅可以向