自然场景图像中的文字定位及提取方法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:udbnny
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然场景下的文字识别由于文字所处背景复杂,很难准确定位到图像或视频中的字符,字符的定位技术成为解决自然场景下文字识别的重要环节。以自然场景图像中的文字定位与提取作为研究内容,它需要解决以下五个问题:一是图像的类型及来源;二是实验的平台;三是图像中文本区域的定位方法;四是针对文本区域如何提取单个字符;最后,对定位的结果如何进行评价。  针对自然场景图像中的文字定位所要解决的问题,提出了一个详细的解决方案。首先,由带有摄像功能的移动终端采集到自然场景中带有文字的彩色图像,图像格式为JPG格式;其次,以 Android平台作为实验平台,在该平台下进行实验,测试定位结果的准确率;第三,提出了基于分层块的文本区域定位方法。该方法先是将彩色图像做灰度化处理,其次进行基于分块及灰度梯度值的边缘提取,再次在边缘图像上作区块标记和连通域分析,得到候选文本区域,最后进行文本区域过滤和文本区域聚合;第四,对得到的文本区域,提出了基于局部重叠阈值分割的文本区域内单个字符提取方法。该方法先是将文本区域作基于局部重叠阈值分割的二值分割处理,得到二值图像,其次将文本区域的二值图像作水平及垂直方向上的投影,根据投影曲线切分出单个字符,最后对得到的字符进行过滤。第五,将自然场景图像中的文字定位方法在Android平台上实现,并对实验的结果进行统计,计算该文字定位算法的准确率。  实验中得到的文字定位的准确率为83%,表明该文字定位算法是有效的,能够将自然场景图像中的大部分文字提取出来。
其他文献
随着嵌入式系统的广泛应用以及网络技术的飞速发展,安全性也显得越来越重要。嵌入式操作系统在嵌入式系统中占有很重要的地位,特别是对增强嵌入式系统的安全性方面,操作系统具有
人脸表情识别有着广泛的应用前景,逐渐成为当前人机交互领域的研究热点之一。表情识别是智能化和自然的人机交互的本质。实现自然和谐的人机交互,必须使计算机能够有效地理解人
虚拟实验室是我国未来实验教学发展的趋势,它在提高学生实际应用水平,节约教育成本等方面发挥了巨大的作用。针对目前专业基础虚拟实验室还比较少的现状,本文提出构建微机接
随着组件技术在软件开发中日益广泛的应用,对软件系统质量的要求也不断提高。因此,保证软件系统可靠性的软件测试技术,也面临着不断革新的需要。由于软件组件自身的一些特点,
虚拟机作为云“环境”的基础设施,随着云“计算”的发展得到了广泛的部署,其安全性也越来越受到业内研究人员和应用开发商的关注。在众多的虚拟机安全问题中,内核rootkit的攻击
经过几十年的蓬勃发展之后,自然语言处理面临着语义知识资源匮乏和处理技术欠缺的瓶颈,语义资源建设对自然语言处理的未来具有重要意义。本文选择中文语义语料库建设作为研究课
客户/服务器计算模型(Client/Server: C/S)是现代互联网应用的核心。结构的简练和高效使其成为Internet的主流,现有应用也多以此为基础。但随着网络应用规模的快速扩展,该模
本文在论述需求工程及需求管理的相关理论和技术方法的基础上,指出有效的需求管理措施是软件项目取得成功的关键。由于目前国内软件行业中,人们对于需求管理的认识尚不够充分
20世纪90年代后期,新型商务和通信的不断创建对软件开发提出了更高的要求。在分析中发现,传统的软件设计、开发方法在设计和开发较大型的软件时显露出开发周期长和成本高的缺
Web站点日志的数据挖掘是对用户与Web服务器的交互产生的日志数据使用数据挖掘技术发现隐含的规律性知识,得到用户的访问模式和用户的兴趣,从而为用户的个性化服务提供依据,