信息资源数字化文本型数字图像OCR识别准确定影响因素及提高策略研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:walger
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息资源数字化工作中的OCR识别,是整项工作的一个有机组成部分,其生命周期可以分为数字扫描对象的获取、数字图像的生产、数字图像的处理和OCR文本识别等四个阶段。OCR识别在信息资源数字化工作中应用时,其准确度一直是人们关注的焦点,因为OCR精确识别是保证数字化产品质量进而为整项工作提供用户保障的一个重要环节。   本文着眼于将OCR识别工作整体作为信息资源数字化工作流程中的一个有机组成部分,同时又将该项工作按照其自身的生命周期的四个阶段依次展开。文章首先基于OCR识别周期,分别详细探讨了每个阶段中可能会对识别准确度造成影响的各种因素。随后,文章在明确文本型数字图像OCR识别准确度的各种相关影响因素的基础上,提出了提高识别准确度的相应策略。鉴于信息资源数字化中OCR识别工作的特点,将重点放在了对数字图像生产、数字图像处理和OCR文本识别这三个阶段中文本型数字图像OCR识别准确度影响因素以及相应提高策略的论述上。   本研究分为四个部分:第一章为引言部分,介绍文章的选题缘起和意义,概述已有的相关研究内容,对所采用的主要研究方法和创新点进行了阐述。第二章为文本型数字图像OCR识别准确度影响因素分析。基于OCR识别生命周期的四个阶段对文本型数字图像OCR识别准确度的一系列影响因素进行全面分析。第三章为文本型数字图像OCR识别准确度提高策略探讨。在第二章的基础上,系统地提出了有针对性的文本型数字图像OCR识别准确度提高策略。第四章为总结,对本文的研究内容进行总结,指出尚存在的不足之处,明确今后的努力方向。
其他文献
会计从业资格证书取消后,技工院校会计专业学生对于会计专业课的学习现状令人担忧,本文分析了这种学习现状,并尝试性的提出来一些解决措施.
距离汶川特大地震发生已有十二年.在第十二个“全国防灾减灾日”,我们以纪念之名警醒,在警醒之时行动.rn犹记得那一场场与时间赛跑、惊心动魄、气壮山河的紧急救援.震后第一
期刊
本文通过对荣华二采区10
本文通过对荣华二采区10
基于职教二十条的主要精神,以15年颁布的最新9号文件为基准,近年教育部门主要目标为"示范校建设
2017年1月中国互联网络信息中心发布第39次《中国互联网络发展状况统计报告》数据表明,截至2016年底我国全部网民规模达到7.31亿人次,互联网普及率达到53.2%。[1]国内互联网的发
区域创新能力是加快区域经济增长和取得区域竞争优势的决定性因素,其强弱是衡量一个区域经济发展的重要尺度,决定着区域发展的潜力与未来的发展方向。随着经济的发展,知识已
作为提升自主学习能力的重要手段,元认知策略对成功学习一门语言有着很重要的作用.任务型教学法强调以学生为中心,通过组织学生在实施任务过程中参与有意义的交流活动来提高
随着中国加入了世界贸易组织,经济的全球化和市场的国际化,必然会有更加频繁更加二十一世纪,中国将全面推进素质教育。中共中央、国务院《关于深化教育改革,全面推进素质教育的决
“二次函数的应用(第1课时)”是浙教版九年级《数学》上册内容,笔者在学校教研活动中听了“二次函数的应用(1)”一课,施教教师的教学过程由情景创设、发现问题、解决问题、巩固