面向移动平台的离线手写文档识别系统

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:liuyong402
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
离线手写文档识别主要是切分图片文档中的不同类型区域,检测表格结构和提取表格单元,并识别含有手写文本的表格内容,加快将纸质手写文档录入计算机的速度。考虑到移动平台的普及率和发展趋势,本文的研究内容实现在Android平台上。由于许多图片文档包含复杂的背景,并且在扫描或者传输过程中会产生噪声等无效信息,如果直接进行处理,会使算法难于设计,处理效果变差。将文档分类为文本元素和非文本元素,然后分别对不同的元素进行处理,可以解决这个问题。因此,本文首先对含有复杂背景的文档预处理的方法进行了介绍,进行二值化和倾斜变换。然后在此基础之上对文本元素和非文本元素进行分离。在只含有非文本元素的文档图像上,依据组成表格元素可能具有的形态特征,筛选出候选元素。然后在文本元素图像上,对落在候选元素包围盒里的文本元素进行提取文本行操作。封闭表格和半封闭表格因为有分隔内外的轮廓线,检测起来比较容易。表格逻辑结构的获取是根据表格内部的文本行在水平和垂直方向上的间距,来确定行和列。平行表格的判定需要制定更多的规则,而这些规则可以用在无线条表格的检测中。彩色表格的处理则是依据彩色图像二值化以后的特征。目前大部分字符识别引擎只能进行单字识别,为了处理连续书写的文本,需要在识别前进行切分,把一张完整的文本行图像分成若干张单字图像,然后送入识别引擎进行识别。如果切分不正确,那么就会对识别引擎的工作形成干扰,无法得到正确的识别结果,降低系统的整体表现。本课题描述了一种改进的投影切分算法,先用不同阈值对文本行进行切分,然后根据切分结果的统计特征选择最优结果,解决了阈值选择的困难,一定程度上减少了错误切分的发生。整个系统选择Android平台作为开发环境,通过本地相册获取文档图像,系统会依次进行文档结构切分、表格检测与识别和手写汉字切分,并将切分结果单字形式传递给后端识别引擎。经过测试,系统在表格内容切分方面达到了86%的成功率,整个系统具有较好的实用价值。
其他文献
企业与政府建立的政治关联在为企业带来隐形利益的同时,也降低了企业对于市场提高会计信息透明度和会计信息质量压力的敏感度。针对政治关联计量方面存在统筹范围狭窄、忽视
随着时代的发展,我国汽车工业也在不断的飞速发展,汽车的生产、使用、维修越来越依赖新技术、新材料、新设备、新工艺,为了跟上这个变化日新月异的行业的脚步,中职汽修专业教
问题一:请问人力资源社会保障部和民政部颁布实施《养老护理员国家职业技能标准(2019年版)》的背景和考虑是什么?人社部职业能力建设司负责同志:《养老护理员国家职业技能标
水性聚氨酯具有优良的环保性能以及突出的机械性能,因而得到了迅速的发展,应用的范围也变得越来越广。但是目前有色水性聚氨酯的含量很少,且采用物理共混或者现有的一些化学
<正>20世纪70年代,西方各国在对其国家进行公共管理的过程中,发生了财政赤字等一系列问题,引起西方国家对政府体制改革的思考,并逐步实施日见成效。十八届三中全会以后,我国
本文以《毛泽东选集》(1一4卷)为语料,从词汇、语法、修辞三个角度对其语言风格进行了综合考察。从词汇特征上看,《毛泽东选集》具有广泛性和社会敏感性;从句法看,运用陈述句
黑龙江省会展业经过多年发展,已经形成一定规模,但与发达省份和国外先进会展业相比,存在着缺乏系统支持,主体实力较弱,展览市场规模较小,规范会展业发展的制度还不够健全,发展会展业
课堂教学中的“教”与“学”是一个互动的有机整体,在新课程背景下语文教师如何做到课堂教学民主、气氛活跃,学生“想学、乐学、会学”并获得自主创新的能力呢?笔者认为应该做到
<正>随着经济全球化的推进,商业模式和交易的不断创新,企业界对会计人才具有较强综合职业能力的诉求越来越强烈。现代的会计人才不仅要具有传统的会计核算和分析能力,还要具