面向新闻字幕识别的视频文本定位与切分方法研究

来源 :北京邮电大学 | 被引量 : 3次 | 上传用户:XULIANSHUAI
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着新闻视频的爆发式增长,对海量新闻视频进行分类、检索和管理的工作变得越来越重要。新闻视频中的文本字幕提供了极其丰富的高层语义信息,能够帮助用户更容易地理解视频内容,所以对视频中的字幕进行准确识别是对视频内容分析和理解的一种有效的方法。考虑新闻视频中的文本字幕背景复杂多变,全局干扰噪音强等特性,为了准确定位新闻视频文本字幕区域,本文采用了一种基于边缘检测和投影的字幕定位方法。针对整幅字幕图片二值化效果差、识别率低的问题,本文采用了一种基于梯度投影的字符切分方法。针对目前还没有新闻视频字幕领域专用的OCR语言库,导致不理想的字幕识别效果的问题,本文利用开源OCR引擎Tesseract训练字符图片样本集,得到用于新闻视频字幕识别的OCR语言库。实验结果表明,本文采用的方法可有效地定位新闻视频中的字幕区域,可以准确地将字幕区域内的字符进行切分,在训练出的语言库上对新闻视频字幕进行识别能有效地提高字幕的识别率,具有良好的实用价值。
其他文献
高性能路由器是高速网络的关键组成设备.目前对高性能路由器技术的研究正朝着系统化、高性能、分布式的方向发展.该文提出了一种基于分布式、可扩展的高性能路由器体系结构,
随着数字化进程的推进与人们防范意识的提高,数字视频监控系统已广泛应用于各个行业,成为现代管理的一种手段,该文以视频压缩技术为基础,以视频信息的传输与储存为重点,在lin
随着移动智能设备的普及,Android系统发展十分迅速,同时也使Android恶意应用快速发展和广泛传播,给Android用户带来严峻的安全隐患。本文通过对Android系统及其安全机制的研
该文研究数据仓库构建工具技术,结合企业数据仓库中低端的应用需要,提出了一种基于元数据的数据仓库构建模式,实现了一套依据该构建模式的数据仓库构建工具,使用该工具用户可
该文首先对网络安全以及生物特征识别技术进行简要的介绍和分析,阐述为何选用生物特征识别方法作为身份认证的基础.其次,该文系统地研究了手写签名识别算法.阐述了整个签名识
该文的主要内容是讨论演化计算和使用演化计算应用于优化问题时的算法设计,并对混合图上的中国邮递员问题给出了有效的算法.首先我们介绍了演化计算的起源和发展,其主要分支,
传统遣传算法对多维、高精度要求的复杂系统优化问题不是很有效,并且不便于充分水利用求解问题专门知识,因此本文研究实数型遗传算法.在分析实数型遗传算法不足的基础上,本文
基于图象序列的三维重建技术是近年来计算机视觉技术与计算机图形学技术相结合而产生的一门新的技术。它利用摄像机拍摄场景或物体不同角度的图象,根据不同图象之间的几何关系
目前,国内许多中小企业迫切需要解决产品物料清单(BOM)管理问题.然而现有BOM管理系统大都以关系数据库方式来组织、存储数据,不能很好解决BOM数据繁杂、种类多、易变等带来的
反演是研究由实测数据推断物理系统模型参数的理论与方法,它广泛应用于自然科学和工程技术的许多领域.由于问题的不适定性和非线性性,反演问题的求解难度较大,因此当前常综合