面向字幕帧的视频图像文本识别

来源 :河北大学 | 被引量 : 0次 | 上传用户:yintaozhy1988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体技术的发展,视频已成为人们获取信息的渠道。面对海量的视频数据库,如何快速有效地进行视频检索已成为研究热点。视频中的字幕信息为视频检索提供了可能。本文主要对视频文件中字幕帧检测和文本定位方法展开研究。首先根据梯度区域值等特征来判断视频帧图像中是否含有字幕;然后采用改进的基于形态学的文本定位方法对检测到的字幕帧图像进行字幕区域定位;为了保证视频文本识别的正常进行,在对几种图像插值算法分析的基础上,选用了适合视频图像的基于最大熵的阈值分割算法对提取出的字幕帧图像进行去噪;最后引进OCR (Optical Characters Recognition,光学字符识别)技术对其进行文字识别。实验表明,本文提出的方法能有效避免虚假的文本区域,对不同的视频图像有较强的适应性。
其他文献
蜱螨是蛛形纲中最大的类群,种类繁多,与人类健康及农牧业生产有着密切的联系。因此,对蜱螨的研究也越来越受到人们的重视。当前信息网络化已经逐步渗透到各行各业,并且也发挥
径向基函数(Radial Basis Function--RBF)方法是一种在多维空间中插值的技术,将其应用于神经网络的研究正处于发展阶段。基本的RBF神经网络是一种三层前馈网络,其收敛速度高
随着多媒体技术的发展,Internet网络除了要进行数据传输之外,还要进行多媒体信息传输,IP网络开始承载着更加丰富的网络应用服务。传统的best-effort服务方式已经不能满足许多
航空在现代交通运输中发挥着越来越重要的作用,航空运输业不断得到发展并出现交通拥堵问题,如何提高航道利用率并保持高的导航性能成为人们普遍关注的问题。评估机载导航性能就
图像具有清晰明了和生动直观的特点,一直以来作为一种存储和交流视觉信息的方式。伴随着科技的进步和人类生活质量的不断提升,人们对图像在视觉上的要求也越来越高,而决定图像视
语义Web服务是将语义Web技术和Web服务技术相结合,利用本体来描述Web服务和Web资源。服务发现是语义Web服务的一个重要环节,发现符合用户需求的服务是实现服务调用、组合的前
近年来以Gnutella为代表的文件共享已经成为Internet上增长最迅速的应用。P2P网络具有容错性好、共享信息可扩展性好、自主性强、负载平衡、匿名等优点,但是在无结构P2P文件
随着信息时代的到来,为得到我们所需要的信息,人们在各个方面对数据处理的要求也越来越高,通过数据之间特有的相关联系能更好地帮助我们进行分析并作出判断,以便采取适当行动。而在金融领域,经济全球化持续发展的大环境下,金融投资已逐渐成为社会生活的一个重要组成部分,金融数据的信息化也正发挥着日益重要的作用。但是金融数据,包括日常股票交易在内,往往受到许多因素的影响,比如人的短期情绪、心理因素与产业发展趋势。
学位
综合集成研讨厅(Hall for Workshop of Metasynthetic Engineering,HWME)是以综合集成方法论为指导的、以研究“开放的复杂巨系统”和解决复杂问题为目的的决策支持系统,它由
随着计算机和互联网技术的迅速发展和普及,尤其是数据挖掘、机器学习、自然语言处理等人工智能技术的发展,智能化教学系统实现技术有了很大进步。个性化学习系统是智能教学系