论文部分内容阅读
在手写识别系统中,手写文字特征提取大都是结合不同语言文字的本身特征采用统计的方法来实现。对于汉字来说,中文汉字不仅类别数多而且还包含很多相似字,另外复杂的汉字形状结构,不同书写人书写的风格差异使得手写汉字的变形很大。目前提取汉字特征时,大多用到汉字基本单元包括横、竖、撇、捺等汉字特有的结构特征,并结合有效的统计特征作为其文字特征。然而由于手写风格的多样化,提取文字的基本单元是一件很困难的事情,而文字特征的正确提取对文字识别系统又有直接的影响,因而探讨如何从手写文字中提取到一种通用且稳定的结构特征就有重要意义。本文在考虑手写文字字形多样化以及不同用户书写习惯等情况下,提出一种基于自然笔划拆分的手写识别方法。本文提出的方法主要包括三个阶段:首先对采集到的手写文字进行自然笔划拆分,获得文字拆分单元。文中我们提出了三种语言无关的拆分规则,分别是基于坐标点之间斜率、曲率的拆分规则及其混合规则;然后本文对上一阶段得到的拆分单元进行归类,并分别根据人工定义的基本单元类别以及根据聚类算法进行基本单元的归类;最后本文采用基于卷积神经网络的分类方法实现文字的识别。由于仅仅以拆分后文字单元类标构成的特征矩阵过于稀疏,文中还研究了为每一文字增加模糊特征重新构造其特征矩阵并进行分类识别。实验中,本文所采用的方法以华南理工采集的SCUT-COUCH2009、哈尔滨工业大学深圳研究生院采集的HIT-OR3C以及中科院采集的CASIA-OLHWDB1的数据集进行训练,以哈尔滨工业大学深圳研究生院HIT-OR3C下面的20套文档集为实验数据。实验发现,本文提出的手写文字表示的高层特征在直接用于分类识别时并未达到预期的效果,但通过采用CNN直接在拆分前后的文字原始特征上建立的识别方法表明,基于自然笔画拆分的模型比没有拆分笔画的模型更具有泛化能力,在单字识别的错误率上降低了27.38%,首选识别正确率达到了95.28%。