【摘 要】
:
网络技术的飞速发展使得信息交互变得更加便捷和高效,图片作为人们在日常生活和工作中常用的信息交流媒介物,其携带的文字信息是该图片的主要关键信息。在人们的日常工作和学习中,会接触到各式各样的证件、票据以及特定结构的文档等等,常常需要将上述文件中的关键信息提取出来录入成电子化。在电子化的过程中,图片转换成文字是核心内容,若通过键盘输入,则需要耗费大量时间和成本,在O CR(Opti cal Charac
论文部分内容阅读
网络技术的飞速发展使得信息交互变得更加便捷和高效,图片作为人们在日常生活和工作中常用的信息交流媒介物,其携带的文字信息是该图片的主要关键信息。在人们的日常工作和学习中,会接触到各式各样的证件、票据以及特定结构的文档等等,常常需要将上述文件中的关键信息提取出来录入成电子化。在电子化的过程中,图片转换成文字是核心内容,若通过键盘输入,则需要耗费大量时间和成本,在O CR(Opti cal Character Recogniti on,光学文本识别)日益凸显的形势下,电子化文档的文本识别系统顺势发展。文本识别是模式识别领域中的一个重要分支,极大的提高了日常工作的效率,并在一定程度上给予了人们生活和工作等各个方面的便捷,在信息录入、资料审核、地图搜索和教育等领域中有广泛且高效的应用。基于此,减少重复工作的次数提高工作效率,为了节省大量的时间,一个面向结构化文档的识别系统是必不可少的。本课题设计和实现一个面用结构化文档的识别系统,结合传统的方法和计算机视觉领域的相关算法,设计和实现识别系统。主要工作内容如下:(1)研究了输入图片对应模版的分类问题。本文设计实现的是一个面向结构化文档的文本识别系统,图像输入并不仅限于某一特定模版,需要对输入图片做模版分类。本文考虑实际系统使用的背景以及不同的方法中存在的影响因素,提出特征匹配的方法来解决模版分类的问题,能够稳定的输出分类结果。(2)研究了文本区域定位的问题。要完成识别,首先要得到目标文本区域的位置信息,如何精准的检测文本区域,并且不局限于某一特定情景,实现对各种背景和不同种类图片中文本的精准定位,本文提出了模版特征映射的文本区域定位方法。(3)研究了文本识别的问题。文本识别结果的好坏直接影响文本识别系统的性能。实际得到的文字区域通常都包含有背景信息,同时不同识别方法带来的效果也不尽相同,为了得到最优识别效果,对不同的识别算法进行实验对比并进行针对性的优化,提出 了基于 CRNN(Convolutional Recurrent Neural Network,卷积循环神经网络)行文本识别的改进算法。(4)输出结果结构化。利用文本识别模型得到预测序列后,将识别得到的字段以key-value的形式将结果结构化。
其他文献
锂离子电池作为新一代能量存储和转换设备,已经被广泛应用于电动汽车、混合电动汽车、便携式电子器件,并进一步应用于大型储能电网、航空航天、通信和轨道交通等领域。开发下
无砟轨道在长期服役过程中,会承受列车荷载和温度荷载等的作用,这将显著影响无砟轨道的承载能力和耐久性。关于其中温度荷载产生的温度场,已有一些研究成果,但对无砟轨道的温度场的长期监测数据的挖掘、地理位置对无砟轨道温度场的影响等研究偏少,而对于无砟轨道温度场的研究也多是局限于有限元法、公式法等,这些方法往往过于复杂,难以推广。针对上述问题,通过建立成都、上海和海宁三个地区的无砟轨道实体模型,对无砟轨道的
人类社会发展至今,出行比之以往越来越频繁,在如今节能减排理念已然成为人们的环境共识下,电动汽车的出现与发展必然符合市场的日益增长需求。电动汽车数量增长之快有目共睹,随之需供给的需求便是电动汽车充电负荷。本文从电动汽车发展基本情况、充电设施等方面做逐一介绍,具体阐述了电动汽车充电方式研究意义,分析对比了其充电方式差异以及优缺点并简要介绍了充电新技术相关发展和理论解析;对韶关市电动汽车充电负荷进行研究
目的:体外和体内模型研究岩大戟内酯B(JolkinolideB,JB)对小鼠黑色素瘤B16F10细胞糖酵解及凋亡的影响。方法:SRB法检测JB对B16F10细胞的生长的影响;Hoechst 33258荧光染色法
核电相比传统能源具有高效、清洁和可持续的优势,在保障核电站安全运行的前提下,充分发挥核电优势可以更好地满足国家电力需求的快速增长,因此对事故工况下核电站的安全可靠
目的:探讨黑蒜提取液抑制胰腺癌Panc-1细胞的增殖与转移的机制,本实验主要研究TGF-β1/Smad4信号转导通路在胰腺癌发展与后期转移中的相关分子的作用与机制。方法:选择胰腺癌
再保险是一种新型且有效的风险管理工具,保险公司可以通过购买再保险合同来有效的降低因为偿还债务的能力不足导致破产的风险.随着风险管理策略的发展,为了平衡保险公司与再保险公司之间的利益,越来越多的学者对最优再保险问题进行了研究.很多文献都是考虑保险公司的利益,基于期望保费原理,通过最小化VaR和CTE风险度量研究最优再保险的问题.众所周知,保险公司和再保险公司的利益是冲突的.因此,本文考虑到再保险公司
STS教育是在现代科学技术迅猛发展和社会呈现巨大变革的背景下出现的,它注重科学、技术、社会三者关系的协调,强调培养学生从社会的大背景下去理解科学与技术。当前我国素质
近年来,双旋翼碟形飞行器以其结构紧凑、机动性强、气动效率高等突出优点,已经成为学者们的研究热点。然而,对于传统的双旋翼共轴式飞行器存在气动布局结构复杂、组成零件多,升力最大化受到机体尺寸限制,控制机构存在惯性大、控制灵敏度较差的问题,不能充分发挥气动系统的优势。基于此提出一种新型喷气式双旋翼碟形飞行器,以其气动布局和控制系统两方面展开了喷气式双旋翼碟形飞行器的结构设计及性能研究,对双旋翼飞行器的性
目的:观察胃癌组织中鸡卵清蛋白上游启动子转录因子Ⅱ(COUP-TFⅡ)和神经纤毛蛋白2(NRP2)的表达变化,并分析COUP-TFⅡ、NRP2表达与胃癌临床病理参数的关系,并利用细胞实验证明