面向新闻字幕识别的视频文本定位与切分方法研究

来源 :北京邮电大学 | 被引量 : 3次 | 上传用户：XULIANSHUAI

【摘要】

：

随着新闻视频的爆发式增长,对海量新闻视频进行分类、检索和管理的工作变得越来越重要。新闻视频中的文本字幕提供了极其丰富的高层语义信息,能够帮助用户更容易地理解视频内

【作者】

：

施银宝

【机构】

：

北京邮电大学

【出处】

：

北京邮电大学

【发表日期】

：

2014年01期

【关键词】

：

新闻视频字幕定位边缘检测字符切分梯度投影 OCR训练

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着新闻视频的爆发式增长,对海量新闻视频进行分类、检索和管理的工作变得越来越重要。新闻视频中的文本字幕提供了极其丰富的高层语义信息,能够帮助用户更容易地理解视频内容,所以对视频中的字幕进行准确识别是对视频内容分析和理解的一种有效的方法。考虑新闻视频中的文本字幕背景复杂多变,全局干扰噪音强等特性,为了准确定位新闻视频文本字幕区域,本文采用了一种基于边缘检测和投影的字幕定位方法。针对整幅字幕图片二值化效果差、识别率低的问题,本文采用了一种基于梯度投影的字符切分方法。针对目前还没有新闻视频字幕领域专用的OCR语言库,导致不理想的字幕识别效果的问题,本文利用开源OCR引擎Tesseract训练字符图片样本集,得到用于新闻视频字幕识别的OCR语言库。实验结果表明,本文采用的方法可有效地定位新闻视频中的字幕区域,可以准确地将字幕区域内的字符进行切分,在训练出的语言库上对新闻视频字幕进行识别能有效地提高字幕的识别率,具有良好的实用价值。

其他文献

高性能路由器体系结构及其关键技术研究

高性能路由器是高速网络的关键组成设备.目前对高性能路由器技术的研究正朝着系统化、高性能、分布式的方向发展.该文提出了一种基于分布式、可扩展的高性能路由器体系结构,

学位

路由器体系结构分布式消息队列事件管理路由查找服务质量

数字视频监控系统设计与实现

随着数字化进程的推进与人们防范意识的提高,数字视频监控系统已广泛应用于各个行业,成为现代管理的一种手段,该文以视频压缩技术为基础,以视频信息的传输与储存为重点,在lin

学位

视频监控MPEG网络传输RTPIP组播

基于并行计算弱KMP模式挖掘算法的Android恶意应用检测

随着移动智能设备的普及,Android系统发展十分迅速,同时也使Android恶意应用快速发展和广泛传播,给Android用户带来严峻的安全隐患。本文通过对Android系统及其安全机制的研

学位

Android恶意信息并行计算弱KMP检测

企业数据仓库构建工具的研制与应用

该文研究数据仓库构建工具技术,结合企业数据仓库中低端的应用需要,提出了一种基于元数据的数据仓库构建模式,实现了一套依据该构建模式的数据仓库构建工具,使用该工具用户可

学位

数据仓库数据仓库系统数据集成ETL

基于手写签名生物特征的认证系统的研究与实现

该文首先对网络安全以及生物特征识别技术进行简要的介绍和分析,阐述为何选用生物特征识别方法作为身份认证的基础.其次,该文系统地研究了手写签名识别算法.阐述了整个签名识

学位

生物特征签名验证特征提取安全模型

演化计算及其在图论中的应用

该文的主要内容是讨论演化计算和使用演化计算应用于优化问题时的算法设计,并对混合图上的中国邮递员问题给出了有效的算法.首先我们介绍了演化计算的起源和发展,其主要分支,

学位

演化计算中国邮递员问题编码方式遗传算法遗传算子

实数型遗传算法的研究及其应用

传统遣传算法对多维、高精度要求的复杂系统优化问题不是很有效,并且不便于充分水利用求解问题专门知识,因此本文研究实数型遗传算法.在分析实数型遗传算法不足的基础上,本文

学位

实数型遗传算法模糊惩罚评价函数随机错位算术杂交算子模糊参数控制最优化计算非线性混合整数规划复杂高维函数优化

基于图象序列的三维重建技术及其应用

基于图象序列的三维重建技术是近年来计算机视觉技术与计算机图形学技术相结合而产生的一门新的技术。它利用摄像机拍摄场景或物体不同角度的图象，根据不同图象之间的几何关系

学位

基于图象序列的三维重建计算机视觉射影重建自定标

物料清单数据仓库系统的研究与应用

目前,国内许多中小企业迫切需要解决产品物料清单(BOM)管理问题.然而现有BOM管理系统大都以关系数据库方式来组织、存储数据,不能很好解决BOM数据繁杂、种类多、易变等带来的

学位

物料清单企业资源计划数据仓库物料清单数据仓库模型数据挖掘

基于演化计算的反演理论与方法

反演是研究由实测数据推断物理系统模型参数的理论与方法,它广泛应用于自然科学和工程技术的许多领域.由于问题的不适定性和非线性性,反演问题的求解难度较大,因此当前常综合

学位

反演问题偏微分方程参数识别演化计算遗传算法遗传程序设计演化建模

面向新闻字幕识别的视频文本定位与切分方法研究

其他学术论文