手写体汉字分割的研究与应用

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:cqy2002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机信息技术的飞速发展,传统的纸张文字已无法满足人们对信息的要求,将纸张文字通过各种扫描设备输入到计算机中,即将传统的纸张文字转化为数字化信息已成为时代的必然趋势。随着各种扫描设备的不断发展,基于OCR光学字符识别系统的电子设备已逐渐投入到使用中来。OCR技术是一种图像信息数字化的过程,主要包括原始图像的输入、图像预处理、字符分割、字符特征提取和字符识别几个步骤。OCR的最终目的是要将纸张信息转化为数字化信息,并进行字符识别,而在该过程中,字符分割是字符识别的一个基础和难点。本文主要针对手写体汉字进行研究,研究重点是字符分割以及图像预处理中的字符图像细化。现有的手写体汉字图像细化和分割方法仍存在许多不足之处,如字符图像细化不彻底、字符图像的误分割或过分割现象等。针对这些不足之处,本文对原有的手写体汉字图像细化方法及分割方法进行了一定的改进,较好的解决了细化不彻底现象与误分割问题。本文主要针对手写体汉字的二值化图像进行研究,这样做可以很好的排除其他因素的干扰,将字符图像与背景相分离,更加关注字符图像的细节信息,有利于进一步的字符图像特征的提取和字符识别。本文所做的主要工作包括:(1)介绍了OCR技术的应用与发展,并针对本文的研究内容,对字符分割的国内外研究现状进行分析。针对手写体汉字的字符特征以及字符特性,分析使用各种方法的优缺点,并对其分割准确度进行比较。(2)介绍了字符图像的预处理工作,主要包括图像去噪、图像二值化以及文本行分割。内容包括进行该工作使用的方法以及进行该预处理的好处,并通过相应的实验效果对比说明进行预处理工作的必要性。(3)主要论述了手写体汉字的字符特征,以及针对手写体汉字的独特性对字符图像进行的细化处理,即手写体汉字细化。简单介绍了字符细化研究现状和研究背景,并针对原有的细化方法进行分析,提出了一种改进的基于数学形态学的手写体汉字细化方法。(4)介绍了字分割方法中的两大难点,粘连字的确认以及如何寻找正确的分裂点。针对原有的基于连通域标记和基于投影的分割方法的不足之处,本文提出了一种改进的基于投影的手写体汉字分割方法。(5)根据论文中所介绍的方法,对手写体汉字图像进行实验,并对实验结果进行分析和比较。对本研究方向中还存在的缺点以及需要改进的地方进行阐述,并介绍了手写体汉字分割在模式识别领域中的应用情况。
其他文献
近几十年来,随着计算机技术和图像处理技术的日益发展,运动视频中的目标检测已经广泛运用到国防与国民经济建设的诸多领域。而随着其应用领域的不断扩大,人们对视频序列中运
随着网格计算、P2P计算、普适计算、云计算、Ad Hoc等大规模分布式应用系统的深入研究,互联网已经转变为一种开放式网络环境。传统的集中式访问控制模型已经无法满足开放网络
近年来,随着信息技术的飞速发展,嵌入式产品被广泛运用到人们的日常生活中,嵌入式实时操作系统(RTOS)亦随之逐渐渗透到学术界、工业界等领域。RTOS是对外部事件响应经过优化的操
计算机网络最初设计的目标,只是实现单纯的端到端数据传送,发展至今的互联网,几乎所有的流量都是建立在TCP/IP架构之上,尽管设备性能有了飞跃性的提高,但网络本身的架构却没
21世纪是网络经济的时代,伴随着互联网的迅速发展,internet上的信息量在不断增加,然而如何从浩瀚的信息海洋中得到所需要的信息就显得更加有意义。在信息检索中,搜索引擎使用
社团划分在生物、医疗等方面有着举足轻重的作用,但是随着数据规模的扩大,经典的串行算法已经不能满足人们的需要,为了能够适应大规模数据的发展和信息化时代的到来,社团划分算法
随着城市中交通堵塞情况的越来越严重,出行者对简洁、高效的路径规划算法的要求日益迫切。如何根据现实的道路交通状况构建合理而有效的路网模型,并在路网模型的基础上设计出
外观设计专利是以图像作为专利保护主要对象,利用传统的基于文本关键字检索方式并不能达到好的检索效果。利用基于图像内容的检索技术可以更好地完成相关检索需求。由于外观专
随着信息技术的高速发展和人们获得数据途径的多样化,企业积累的数据飞速激增。由于这些数据里面隐含着很多有用的信息,可以通过数据挖掘来进一步的分析和充分的利用。但是很
随着计算机的诞生,短短的几十年间,计算机网络的发展已经是翻天覆地,从最开始的终端网络,到C/S、B/S网络模式,再到如今的P2P点对点等多种网络叠加的混合网络模式,这些无疑给人们带