论文部分内容阅读
随着计算机网络与多媒体技术的飞速发展,数字多媒体得到广泛应用,视频已经逐步成为信息传播的主流载体之一。借助多媒体处理软件,视频可以被转换成各种不同的版本,数字版权的保护问题逐渐成为困扰诸多视频内容提供商的难题。尽管随之产生的物理防拷贝技术和数字水印等技术能起到一定作用,却无法解决数字视频在已经被非法传播之后的版权鉴定问题。基于内容的同源视频检索(Content-based video copy detection)技术,被认为是解决这一难题的一个有效方法。本文从视频内容的有效表达、视频的检索与匹配和视频索引几个方面对基于内容的同源视频检索进行了深入研究;提出了一些新的算法,解决了同源视频检索中的几个关键问题:在视频内容的表示方面,提出了一种特征点的优化选择算法,改进了SIFT (Scale Invariant Feature Transform)特征,提高了旋转、平移不变特性。随后利用基于视觉字典(Visual vocabulary)的特征点投影算法,实现高维关键点特征量化;最后提出二进制签名和排序签名算法改善了特征的匹配精度。实验表明,该算法能有效兼顾特征点的匹配速度和精度,满足同源视频检索的需求。在视频的检索与匹配方面,提出了一个基于视频帧的时间连续性的视频相似性度量及匹配策略,改善了同源视频的检索的准确性。对不同变换视频中具有相同时间差的匹配图像对进行分组统计,修正了候选的匹配视频段的相似度,得到最优的匹配结果。实验表明,该算法有效降低了同源视频检索中的误检率。在视频索引的建立方面,设计了一种新的基于视觉字典的倒排索引结构,提高了同源视频检索的速度。实验表明,该算法使检索效率得到飞速提升,实现海量视频的快速查询。最后提出了一个通用的同源视频检索系统框架,参加TRECVID2009同源视频检索评测的结果表明,本系统的整体性能远高于所有参赛队的平均水平。