视觉文档图像光学失真的校正

来源 :河北大学 | 被引量 : 0次 | 上传用户:pisahaochima
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文档的数字化是建设信息化社会的迫切需要,作为转换工具的OCR(Optical Character Recognition,光学字符识别)技术已得到广泛应用。随着数字成像设备的普及,OCR技术开始进入视觉文档图像这一领域。本文针对视觉文档图像的光学失真进行校正,主要包括椒盐噪声的去除、消除图像模糊、曝光不良的处理、积厚阴影的消除和单幅图像的超分辨率探讨五个组成部分。主要工作如下:对于文档图像中存在的椒盐噪声,改进了基于笔画特性的椒盐噪声处理方法。改进后的算法不仅不会产生文字模糊或笔画丢失,而且能有效适应多语种文字的图文混排,合理进行阈值判断,有效去除文档图像中的椒盐噪声。对于模糊的文档图像,改进了提取文字骨架来处理模糊的算法。该算法根据文档图像的特性,将常见字体分为两大类,并对每类字体设计不同的求阈值方法,改进后的算法,能够有效地消除图像的模糊。对于曝光不良的视觉文档图像,改进了基于目标和背景分离的目标增强算法。改进后的算法对含版画类插图的视觉文档图像,先利用二值化和数学形态学方法对插图位置进行判定,再对插图区和剩余区分别进行不同的增强处理,实验结果表明,较之改进前,能更好地处理视觉文档图像。对于视觉文档图像中的积厚阴影,本文实现了已有的“借鉴视觉图像曝光不良的校正”来处理积厚阴影的算法。实验表明,该算法能有效去除视觉文档图像中的积厚阴影。针对小字号文字的OCR识别率不高的情况,本文提出一种先进行插值放大,再利用小波分解,并对图像的高频信息进行增强,最后小波逆分解合成的方法,该方法经实验验证,能有效地对放大后的文字边缘进行增强,提高OCR识别率。
其他文献
与传统的周期性汇报或基于查询的无线传感器网络不同,事件驱动型无线传感器网络只有在监测范围内的事件发生时才向Sink节点发送事件报警消息,无事件发生时只发送一些网络健康状
图论是组合数学领域的一个分支,20世纪60年代末,随着计算机技术的产生和发展,组合数学,特别是图论理论得到了人们越来越多的关注,时至今日,人们面对的计算模型以及数据结构仍然在变
随着计算机和互联网的发展,在自然语言处理领域,以双语(或多语)平行语料库为基础的应用日益增多。除机器翻译方面的应用之外,平行语料库的建设对于双语词典编撰、词义消歧和跨语言
粗糙集能有效地处理不精确、不完整等各种不完备的信息与知识,它与其他不确定性理论的最大区别就是除了需要处理的数据集外,不需要其他任何先验知识,通过直接对数据进行分析
XML(extensible markup language,可扩展标志语言)是由World Wide Web Consortium(W3C)的XML工作组定义的。XML以其扩展性、结构性、平台独立性和自描述性等特性成为数据表示
实体解析是指对同一实体的不同的表现形式进行识别、连接和分组,它在数据库管理、机器学习和信息检索中均有广泛应用。传统的实体解析方法主要针对小数据集,重点关注解析结果
近几年来,随着众多P2P系统地出现,P2P网络技术逐渐成为人们研究的热点。P2P网络技术是基于一种对等的思想,这种思想正在改变着人们对网络模式的思考。P2P网络技术目前主要应用在
在一些无线传感器网络的应用系统中,如事件检测和异常检测系统,带有异常信息的数据在传输时对实时性要求是很高的,要尽最大的可能使得该数据在一个限定的时间内传送到目的节
随着无线技术的不断发展,越来越多的用户选择通过无线局域网(WLAN)接入互联网;这一趋势使得提高无线宽带接入的质量逐步成为了研究热点。近年来,在WLAN的基础上出现了多跳无
量子计算是新近发展起来的,利用量子力学原理进行信息处理的前沿学科。随着理论与技术的成熟及更多专家和学者加入该领域的研究,量子计算得到突飞猛进的发展,对计算机科学的发展