表格手写内容识别系统的设计与实现

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:luomingasdf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机硬件的发展以及人工智能理论的不断完善,越来越多的简单重复性脑力劳动开始被计算机所取代,不仅极大地提高了效率,而且将人们从枯燥单调的脑力劳动中解放出来。针对目前仍存在大量手写表格类的文档需要人工录入计算机,根据数学形态学及模式识别的相关原理,设计了表格手写内容识别系统,可以自动分析各种试卷、档案及调查问卷并将其信息录入至计算机。通过这一系统,可提高统计工作的效率,减少人力投入。系统采用了模块化的设计原理,通过不同模块组合能够搭建针对不同表格文件类型的识别平台。信息录入主要经过三个步骤:一是针对扫描的文件图片进行预处理,去除噪点及干扰部分,并且在图片中强调有用信息;二是提取出表格框架并且得到表格中各个单元格的位置信息,并且按单元格依次输出待识别图像;三是利用结构体识别法对得到的图像进行识别并将识别结果录入计算机,针对不同的字符集有不同的结构体识别方法,同时系统在识别过程中对于模棱两可的字符会抛出留待人工识别,以提高识别的准确度。经过实验证明,表格手写内容识别系统可准确有效的从文件中查找到需要统计的信息并进行识别,识别率能够满足应用要求。系统配合能够快速扫描文件的复印一体机,可以应用在各种需要识别手写表格文件的场合,能够提高信息录入效率,节约人力资源。
其他文献
商业智能工具迅速发展,多维查询技术日趋成熟,在线联机分析系统查询效率的提升成为急需解决的问题。聚集技术是提升在线联机分析系统性能的关键技术之一。在分析达梦聚集技术
多种生物克隆实验结果说明,存在于细胞核染色体中的DNA序列包含了该生命体的全部信息。生物序列进行序列比对后,所得结果包含了序列之间的关系和进化的信息,利用这些信息可以得
随着计算机时代的迅猛发展,分析网络的安全性相当重要。保证安全协议的安全性及秘密性已是网络安全领域的最热门话题之一。安全协议自身的缺陷给网络安全造成了巨大的威胁,为
随着3G时代的到来,高端手机的普及,以及中国移动条码增值业务的推动,基于手机端的二维条码识读技术已成为当今条码识读技术的一个热点研究方向。一种高效、快速、健壮的手机条码
多分类器集成,也称多分器组合或多分类器联合,近年来,多分类器融合技术在人脸识别、手写字符识别、遥感图像分类等方向上受到了广泛重视,显示出很大的研究价值和现实应用前景
随着互联网视频数据的快速增长和相关新型应用的涌现,视频的高效压缩和传输成为学术界和产业界深入研究的热点问题。   本文提出了一种新的视频编码和传输框架,该框架应用多
H.264视频压缩编码标准凭借着编码质量高,低码率,网络亲和性等特点在CMMB(China Mobile Multimedia Broadcasting)手机电视中获得应用,但手机的处理能力低,H.264解码的计算复
巷道作为矿山项目中重要的空间要素,它在数字矿山系统中占有十分重要的位置。由于巷道在地下纵横交错,单纯用二维图形很难直观的表达出地下巷道几何形态和所处的空间位置,因
脱机手写数字识别是一个至今仍没有完美解决的问题,是一个很有挑战的问题。它有着广泛而重要的应用需求,如识别邮政编码、银行收据、税收票据、各种打印手写的数字等等,这吸
随着电信行业的飞速发展,除了电信的传统业务如宽带业务外,电信获得了3G牌照以后,企业获得了又一次的飞跃发展的机会,而带来这次发展的契机就是电信的移动业务,进入了3G时代,