【摘 要】
:
图像和视频中的文本字符,是图像高层语义内容的一个重要来源,它包含许多非常重要的有用的信息,如街道名称、商店名称、路标、交通标示、字幕等,这些信息对于图像和视频资料的
论文部分内容阅读
图像和视频中的文本字符,是图像高层语义内容的一个重要来源,它包含许多非常重要的有用的信息,如街道名称、商店名称、路标、交通标示、字幕等,这些信息对于图像和视频资料的自动注释、索引、压缩等方面有重要的参考作用。通常情况下根据文本对象的存在形式将文本分为人工文本和场景文本。目前的研究主要集中于对人工文本的研究,而场景文本的研究刚刚起步。文本提取的研究思路主要集中于应用各种图像处理的方法将文字区域的边角特征、色彩特征和纹理特征突出,然后根据一定的分类算法来划分候选的区域,经过进一步的后处理来最终确定实际的文本区域。本文针对文本区域提取这个问题来进行研究,包含预处理、多分辨分析、特征提取、分类(检测)、区域提取五个步骤来解决文本区域的准确提取问题。由于图像上字符的大小变化范围很大,为了能够找出大小不一的文本区域,在多分辨分析中,本文将图像分解为原分辨率的1/1、1/2和1/4的三幅子图,然后对每幅子图应用相同的文本区域定位算法。在特征提取步骤中,本文把一致性H应用到文本区域提取领域,使用边缘空间映射和一致性H空间映射两种方法得到特征图像,并比较了两种空间对于文本提取的影响;对得到特征图像,使用滑动窗口比较了提取不同维数的纹理特征作为特征向量的结果。在分类检测时,通过对比支持向量机(Support Vector Machine SVM)和BP前馈网络的分类效果,选择使用支持向量机作为分类器。根据对多幅子图的分类结果进行图像融合来生成候选区域,然后逐步对候选区域进行基于密度的区域确认和平滑后处理等步骤确定最终的文本区域。通过实验表明使用一致性H变换后提取25维特征,经过支持向量机分类可以较为准确的提取出文本区域,得到较为理想的评价指标。
其他文献
顶板事故作为煤矿的主要安全事故给国家财产和人民的生命安全造成了巨大的损失和威胁。据国家有关部门统计,我国煤矿发生顶板死亡事故占煤矿死亡事故的40%~50%,其中80%发生在采场,工
在过去的几十年间,许多经典的模型在信息检索领域诞生,诸如布尔模型、向量空间模型以及概率模型等。1998年,Ponte和Croft首次将统计语言模型应用于信息检索,并且提出了查询似然语
VoIP系统一般基于SIP(Session Initiation Protocol)或H.323两种通信控制协议。SIP协议具有结构简洁、易于扩展和适合Internet接入等良好的特性,它可以有效地控制媒体网关,控
近几年来,随着互联网的发展,在线社交网络(如Facebook、Twitter等)的成功应用,网络上存在大规模的真实社会数据,催生了社交网络在计算机领域的蓬勃发展。在信息传播研究领域,病毒式
作为移动自组织网络向实用化方向的发展,机会网络可以在缺乏基础设施的环境中,利用“存储-携带-转发”的方式进行消息传输,从而能够在节点间连通性得不到保证的情况下实现端到端
在用计算机数字化现实世界的过程中,相对于以往二维图像,三维数据具有其先天的优势。随着现代三维扫描与建模技术的提高,基于采样点的三维数据模型即点云模型,已经逐渐结合到许多
当前Internet互联网的标准协议是IP的第4版,即IPV4,而IPV4由于地址资源枯竭和路由表爆炸等致命问题,已经面临着更新换代的必要。IP第6版,即IPV6是作为IPV4协议的后继者而由因
XML正逐渐成为Internet上数据表示和数据交换的新标准,网络上存在大量的XML格式的可操作数据和其他商业信息。鉴于这些商业信息的敏感特性,增加了保护XML文档的重要性,迫切需
面对日益激烈的市场竞争和快速多变的市场需求,协同设计(CSCD)作为一种新的产品开发方式,为越来越多企业所采用。在协同设计中,产品数据管理(PDM)是集成和管理所有的应用、信
在军事领域中,诸如雷达、声纳等信号处理系统的性能不断提高,对计算机的处理速度提出了更高的要求。并行处理是提高计算机性能、可用性与可靠性的重要途径。目前,并行硬件技